प्रौद्योगिकी साझेदारी

LLMs इत्यस्य gptpdf: gptpdf इत्यस्य परिचयः, संस्थापनस्य उपयोगस्य च पद्धतयः, तथा च केस अनुप्रयोगानाम् विस्तृतमार्गदर्शिका

2024-07-08

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

LLMs इत्यस्य gptpdf: gptpdf इत्यस्य परिचयः, संस्थापनस्य उपयोगस्य च पद्धतयः, तथा च केस अनुप्रयोगानाम् विस्तृतमार्गदर्शिका

सामग्रीसूची

gptpdf इत्यस्य परिचयः

1. प्रसंस्करणप्रक्रिया

प्रथमं सोपानं PDF इत्यस्य सर्वाणि अपाठक्षेत्राणि विश्लेषयितुं तान् चिह्नितुं PyMuPDF पुस्तकालयस्य उपयोगः भवति, यथा:

द्वितीयपदे, मार्कडाउनसञ्चिकां विश्लेषयितुं प्राप्तुं च विशालं दृश्यप्रतिरूपं (यथा GPT-4o) उपयुज्यताम् ।

gptpdf संस्थाप्य उपयोगः कथं भवति

1. स्थापना

2. प्रयोगः

test.py कोडस्य व्याख्यां कुर्वन्तु

३、एपि

gptpdf के केस एप्लीकेशन


gptpdf इत्यस्य परिचयः

gptpdf एकं साधनं यत् मुख्यतया दृश्यबृहत्भाषाप्रतिमानानाम् (यथा GPT-4o) उपयोगं कृत्वा PDF इत्यस्य मार्कडाउन् मध्ये विश्लेषणं करोति ।अस्माकं दृष्टिकोणः अतीव सरलः (केवलं २९३ पङ्क्तयः कोडः) परन्तु प्रायःमुद्रणकला, गणितीय सूत्र, सारणी, चित्र, चार्ट आदि सम्यक् विश्लेषण करें। . प्रतिपृष्ठस्य औसतमूल्यं केवलं $0.013 अस्ति, तथा च वयं OpenAI API इत्यनेन सह अन्तरक्रियायै GeneralAgent lib इत्यस्य उपयोगं कुर्मः । pdfgpt-ui इति gptpdf इत्यस्य आधारेण निर्मितं दृश्यीकरणसाधनम् अस्ति ।

गिथुब पताGitHub - CosmosShadow/gptpdf: PDF विश्लेषणार्थं GPT इत्यस्य उपयोगः

1、प्रसंस्करण प्रवाह

प्रथमं सोपानं PDF इत्यस्य सर्वाणि अपाठक्षेत्राणि विश्लेषयितुं तान् चिह्नितुं PyMuPDF पुस्तकालयस्य उपयोगः भवति, यथा:

द्वितीयपदे, मार्कडाउनसञ्चिकां विश्लेषयितुं प्राप्तुं च विशालं दृश्यप्रतिरूपं (यथा GPT-4o) उपयुज्यताम् ।

gptpdf संस्थाप्य उपयोगः कथं भवति

1、प्रतिस्था

pip install gptpdf

2、उपयुञ्जताम्‌

from gptpdf import parse_pdf

api_key = 'Your OpenAI API Key'
content, image_paths = parse_pdf(pdf_path, api_key=api_key)
print(content)

अधिकविवरणार्थं test/test.py पश्यन्तु

पत्रसङ्केतः:https://github.com/CosmosShadow/gptpdf/blob/मुख्य/परीक्षण/परीक्षण.py

test.py कोडस्य व्याख्यां कुर्वन्तु

import os

# 从 .env 文件中加载环境变量
import dotenv
dotenv.load_dotenv()

def test_use_api_key():
    from gptpdf import parse_pdf
    pdf_path = '../examples/attention_is_all_you_need.pdf'
    output_dir = '../examples/attention_is_all_you_need/'
    # 从环境变量中获取 OPENAI_API_KEY 和 OPENAI_API_BASE
    api_key = os.getenv('OPENAI_API_KEY')
    base_url = os.getenv('OPENAI_API_BASE')
    # 手动提供 OPENAI_API_KEY 和 OPENAI_API_BASE
    content, image_paths = parse_pdf(pdf_path, output_dir=output_dir, api_key=api_key, base_url=base_url, model='gpt-4o', gpt_worker=6)
    # 输出解析后的内容和图像路径
    print(content)
    print(image_paths)
    # 同时会生成 output_dir/output.md 文件

def test_use_env():
    from gptpdf import parse_pdf
    pdf_path = '../examples/attention_is_all_you_need.pdf'
    output_dir = '../examples/attention_is_all_you_need/'
    # 使用环境变量中的 OPENAI_API_KEY 和 OPENAI_API_BASE
    content, image_paths = parse_pdf(pdf_path, output_dir=output_dir, model='gpt-4o', verbose=True)
    # 输出解析后的内容和图像路径
    print(content)
    print(image_paths)
    # 同时会生成 output_dir/output.md 文件

def test_azure():
    from gptpdf import parse_pdf
    # Azure API Key
    api_key = '8ef0b4df45e444079cd5a4xxxxx' 
    # Azure API 基础 URL
    base_url = 'https://xxx.openai.azure.com/' 
    # Azure 部署的模型 ID 名称(不是 OpenAI 模型名称)
    model = 'azure_xxxx'

    pdf_path = '../examples/attention_is_all_you_need.pdf'
    output_dir = '../examples/attention_is_all_you_need/'
    # 使用提供的 Azure API Key 和基础 URL
    content, image_paths = parse_pdf(pdf_path, output_dir=output_dir, api_key=api_key, base_url=base_url, model=model, verbose=True)
    # 输出解析后的内容和图像路径
    print(content)
    print(image_paths)

if __name__ == '__main__':
    # 取消注释以运行特定的测试函数
    # test_use_api_key()
    # test_use_env()
    test_azure()

३、एपि

parse_pdf(pdf_path, output_dir = './', api_key = कोई भी नहीं, base_url = कोई नहीं, मॉडल = 'gpt-4o', verbose = गलत)
pdf सञ्चिकां markdown सञ्चिकायां विश्लेष्य markdown सामग्रीं सर्वेषां चित्रमार्गाणां सूचीं च प्रत्यागच्छतु ।

  • pdf_मार्गः:pdf सञ्चिकामार्गः

  • output_dir : आउटपुट् निर्देशिका।सर्वाणि चित्राणि मार्कडाउन् सञ्चिकाः च संग्रहयन्तु

  • अपि_की : OpenAI API कुञ्जी (वैकल्पिकम्)। यदि न प्रदत्तं तर्हि OPENAI_API_KEY वातावरणचरस्य उपयोगः भवति ।

  • आधार_उर्ल् : OpenAI आधार URL। (वैकल्पिक)। यदि न प्रदत्तं तर्हि OPENAI_BASE_URL वातावरणचरस्य उपयोगः भवति ।

  • प्रतिकृति : OpenAI API प्रारूपेण बहुविधं बृहत् मॉडलं, पूर्वनिर्धारितं "gpt-4o" अस्ति । यदि भवन्तः अन्येषां मॉडलानां उपयोगं कर्तुं प्रवृत्ताः सन्ति यथा...