वेबसाइटें

Able2Extract अधिक उपयोग करने योग्य प्रारूपों में पीडीएफ को परिवर्तित करता है

परिचय Able2Extract 10: डेटा निष्कर्षण के अगले स्तर

परिचय Able2Extract 10: डेटा निष्कर्षण के अगले स्तर
Anonim

यदि आप किसी एडोब पीडीएफ दस्तावेज़ से पाठ को खींचने के लिए कभी भी जरूरी है, आप जानते हैं कि यह कितना निराशाजनक हो सकता है। वर्चुअल सार्वभौमिक फ़ाइल प्रारूप वास्तव में एक दस्तावेज़ से टेक्स्ट का पुन: उपयोग करना आसान बनाता है और इसे दूसरे में पेस्ट करता है। फ़ॉर्मेटिंग, लाइन-स्पेसिंग, और छवियां सभी पीडीएफ दस्तावेज़ों को चुनौती देने के लिए षड्यंत्र करती हैं। लेकिन Able2Extract ($ 100, 7-दिन का नि: शुल्क परीक्षण) इस कठिन कार्य के बच्चे के खेल को बनाता है।

Able2Extract जानकारी पीडीएफ को अधिक संपादन योग्य प्रारूपों में परिवर्तित करता है, जैसे कि माइक्रोसॉफ़्ट ऑफिस अनुप्रयोगों द्वारा उपयोग किए जाने वाले।

Able2Extract बस पीडीएफ दस्तावेज़ को पढ़ता है, फिर टेक्स्ट, ग्राफिक्स, टेबल, और अन्य सामग्री को आपकी पसंद के माइक्रोसॉफ़्ट ऑफिस प्रारूप दस्तावेज़ में टाइप करता है - वर्ड, एक्सेल, या पावरपॉइंट। लाइन रिक्ति और स्वरूपण कार्यक्रम की योग्यता के लिए सबसे सुरक्षित हैं: टेबल अजीब स्थानों में पैराग्राफ को तोड़ने का कारण नहीं बनेंगे। न ही इनलाइन ग्राफिक्स, जिन्हें संरक्षित किया जाता है और पीडीएफ दस्तावेज़ में उसी स्थान पर Office दस्तावेज़ों में स्थानांतरित किया जाता है।

उत्पाद के व्यावसायिक संस्करण के लिए आपके द्वारा भुगतान किया गया $ 30 प्रीमियम एक प्रमुख विशेषता में जोड़ता है: ऑप्टिकल कैरेक्टर रिकॉग्नाइजेशन, या ओसीआर। ए 2 ई प्रो उन पीडीएफ दस्तावेजों में पढ़ा जा सकता है जिन्हें छवि फ़ाइल के रूप में स्कैन किया गया था, और न केवल छवियों को पाठ में परिवर्तित करने का एक उल्लेखनीय अच्छा काम करता है, लेकिन मूल दस्तावेज़ में उपयोग किए गए पेजिनेशन, लेआउट और यहां तक ​​कि टाइपफेस को पुन: पेश करने पर भी।

एडोब एक्रोबैट उपयोगिता (या "पीडीएफ पर प्रिंट करें) का उपयोग करके जेनरेट किए गए पीडीएफ से टेक्स्ट निकालना एक स्नैप था; एक 20 पेज दस्तावेज़, इनलाइन छवियों के साथ, एक तालिका जो पाठ के चारों ओर बहती है, और अन्य विवरण, को माइक्रोसॉफ्ट वर्ड। डॉक फ़ाइल में बेकार ढंग से पुन: उत्पन्न किया गया था। ओसीआर को प्रो संस्करण का उपयोग करना एक खराब-पुनरुत्पादित दस्तावेज़ जिसे मूल रूप से टाइपराइटर के साथ टाइप किया गया था, फिर स्कैन किया गया था, एक चुनौती थी।

यह प्रोग्राम को 3 मिनट और 15 सेकंड तक ले गया ताकि अन्यथा विनाशकारी ढंग से स्कैन किया जा सके 62 पेज टेस्ट पीडीएफ। मामूली टाइपो दिखाई दिए, जहां कुछ पृष्ठों पर मार्जिन में हस्तलिखित नोट दिखाई दिए - लेकिन यह उन लोगों को पुन: उत्पन्न करने के लिए कड़ी मेहनत की कोशिश की। मूल फैक्स के माध्यम से भेजा गया था, और फैक्स पाद लेख, खराब गुणवत्ता स्कैन में फीका, समान रूप से पुन: उत्पन्न नहीं किया था - लेकिन यह भी पूरी तरह से अपरिपक्व था। जब आप प्रोग्राम में पीडीएफ फ़ाइल लोड करते हैं, तो आप उस पृष्ठ के भाग को खींच सकते हैं जिसे आप कनवर्ट करना चाहते हैं; अगर मैंने रूपांतरण को बेहतर तरीके से योजना बनाई थी, तो मैंने इन अनावश्यक पाद लेखों और मार्जिन में नोटों का चयन करने से बचा होगा।

प्रकाशक का एक प्रतिनिधि मुझे बताता है कि पीडीएफ दस्तावेज़ों में चित्र या स्केच स्कैन किए जा सकते हैं और फ़ाइल स्वरूप में आउटपुट कर सकते हैं उन्हें ऑटोकैड द्वारा लोड करने देता है। हालांकि मैंने इस सुविधा का परीक्षण नहीं किया है, लेकिन मैं देख सकता हूं कि यह एक वास्तुकार, अभिलेखीय, या इतिहासकार के लिए अविश्वसनीय रूप से उपयोगी कैसे हो सकता है, खासकर अगर पीडीएफ में स्कैन किए गए ब्लूप्रिंट मूल रूप से कंप्यूटर में डिज़ाइन नहीं किए गए थे। सब कुछ, मैं Able2Extract से प्रभावित था।