基于雙重OCR技術(shù)的智能數(shù)據(jù)識(shí)別與集成項(xiàng)目公開比選文件一、項(xiàng)目介紹為提升指定書籍掃描電子版的數(shù)據(jù)處理效率和準(zhǔn)確性,本項(xiàng)目將采用本地化部署的兩套不同的OCR服務(wù),實(shí)現(xiàn)文檔、書籍內(nèi)容進(jìn)行深度識(shí)別和智能糾正。系統(tǒng)將自動(dòng)提取所需目錄、類別、名稱及內(nèi)容信息。識(shí)別結(jié)果將通過智能校對(duì)機(jī)制進(jìn)行空格、標(biāo)點(diǎn)、錯(cuò)別字及疑似語義錯(cuò)誤的檢查與糾正。當(dāng)兩套OCR識(shí)別內(nèi)容存在差異時(shí),系統(tǒng)將實(shí)現(xiàn)最優(yōu)項(xiàng)自動(dòng)化選擇或推送至人工復(fù)核。系統(tǒng)采用智能比對(duì)和人工校驗(yàn)手段,經(jīng)過精確識(shí)別與校對(duì)的結(jié)構(gòu)化數(shù)據(jù),最終將通過接口集成至知識(shí)生產(chǎn)平臺(tái)的標(biāo)簽管理系統(tǒng)。二、項(xiàng)目建設(shè)周期及限價(jià)項(xiàng)目實(shí)施時(shí)間要求:建設(shè)周期不超過60工作日,試運(yùn)行不少于20個(gè)自然日,建成后維保1年。限價(jià)15萬。三、項(xiàng)目?jī)?nèi)容31采購內(nèi)容清單序號(hào)模塊子模塊描述1數(shù)據(jù)識(shí)別OCR服務(wù)部署提供兩套OCR識(shí)別服務(wù)的本地化部署,確保數(shù)據(jù)處理在本地環(huán)境中進(jìn)行。2圖像文本識(shí)別依據(jù)客戶提供的掃描電子版,執(zhí)行高精度的文本識(shí)別處理。3關(guān)鍵信息提取根據(jù)業(yè)務(wù)需求,從識(shí)別內(nèi)容中自動(dòng)提取指定的目錄、類別、名稱、內(nèi)容等結(jié)構(gòu)化字段。4智能校對(duì)自動(dòng)化文本校對(duì)提供智能校對(duì)服務(wù),自動(dòng)檢查并修正識(shí)別結(jié)果中的空格、標(biāo)點(diǎn)符號(hào)及錯(cuò)別字問題。5語義邏輯檢查對(duì)校對(duì)后的文本進(jìn)行初步的語義分析,識(shí)別并標(biāo)記疑似語義邏輯錯(cuò)誤的內(nèi)容。6AI識(shí)別結(jié)果比對(duì)與優(yōu)選開發(fā)內(nèi)容比對(duì)與選擇機(jī)制。當(dāng)兩套OCR識(shí)別結(jié)果不一致時(shí),系統(tǒng)可自動(dòng)化選擇最優(yōu)項(xiàng),或?qū)⒉町愴?xiàng)推送至人工進(jìn)行確認(rèn)。7系統(tǒng)集成知識(shí)平臺(tái)接口開發(fā)開發(fā)標(biāo)準(zhǔn)數(shù)據(jù)接口,用于將經(jīng)過識(shí)別與校對(duì)的結(jié)構(gòu)化數(shù)據(jù)推送至知識(shí)生產(chǎn)平臺(tái)的標(biāo)簽管理系統(tǒng)。8人工復(fù)核功能提供簡(jiǎn)易的人工復(fù)核操作界面,用于處理系統(tǒng)自動(dòng)推送的、存在識(shí)別差異的內(nèi)容。9運(yùn)行環(huán)境運(yùn)算主機(jī)租用提供滿足本地化OCR服務(wù)運(yùn)行所需的高性能運(yùn)算主機(jī)租用服務(wù),包含必要的運(yùn)算與存儲(chǔ)資源。10OCR識(shí)別和標(biāo)簽提取任務(wù)《道教大辭典》校對(duì)后形成分類標(biāo)簽和解釋《簡(jiǎn)明中外民俗詞典》根據(jù)實(shí)際應(yīng)用開展,可做同類型參考書目替換。32詳細(xì)需求1數(shù)據(jù)識(shí)別(1)OCR服務(wù)部署要求供應(yīng)商提供并完成兩套OCR識(shí)別服務(wù)的本地化部署。整個(gè)部署過程需在客戶指定的本地服務(wù)器環(huán)境中進(jìn)行,確保所有數(shù)據(jù)識(shí)別處理均在內(nèi)部網(wǎng)絡(luò)完成,不依賴外部公有云服務(wù)。部署內(nèi)容應(yīng)包括軟件的安裝、參數(shù)配置、運(yùn)行環(huán)境驗(yàn)證及初始化測(cè)試,以保證兩套服務(wù)均能穩(wěn)定、可靠地接收?qǐng)D像數(shù)據(jù)并執(zhí)行識(shí)別任務(wù)。(2)圖像文本識(shí)別要求OCR服務(wù)能夠?qū)蛻籼峁┑闹付〞畳呙桦娮影孢M(jìn)行高精度文本識(shí)別。服務(wù)需支持常見的圖像格式,并能有效處理不同清晰度、字體和版式下的文本內(nèi)容,將圖像中的文字信息準(zhǔn)確地轉(zhuǎn)換為機(jī)器可讀的文本格式,為后續(xù)的信息提取和校對(duì)提供原始數(shù)據(jù)基礎(chǔ)。(3)關(guān)鍵信息提取系統(tǒng)需具備關(guān)鍵信息提取能力,能夠在OCR識(shí)別出的全文內(nèi)容中,根據(jù)預(yù)設(shè)的規(guī)則或模型,自動(dòng)定位并抓取業(yè)務(wù)所需的關(guān)鍵字段,如類別、名稱、具體內(nèi)容等。提取結(jié)果應(yīng)以結(jié)構(gòu)化的數(shù)據(jù)格式輸出,便于后續(xù)直接進(jìn)行處理和系統(tǒng)集成。2智能校對(duì)(1)自動(dòng)化文本校對(duì)需提供自動(dòng)化文本校對(duì)功能,對(duì)OCR服務(wù)輸出的文本結(jié)果進(jìn)行系統(tǒng)性檢查與修正。該功能應(yīng)能自動(dòng)識(shí)別并糾正文本中常見的錯(cuò)誤,包括不規(guī)范的空格使用、標(biāo)點(diǎn)符號(hào)錯(cuò)誤以及常見的錯(cuò)別字,以提升文本內(nèi)容的規(guī)范性和準(zhǔn)確性。(2)語義邏輯檢查系統(tǒng)應(yīng)具備初步的語義邏輯分析能力,對(duì)經(jīng)過基礎(chǔ)校對(duì)的文本進(jìn)行檢查,識(shí)別并標(biāo)記出可能存在語義矛盾或邏輯不通順的句子或段落。此功能用于輔助發(fā)現(xiàn)深層次的識(shí)別錯(cuò)誤,并將疑似問題點(diǎn)進(jìn)行高亮或標(biāo)記,以供后續(xù)處理。(3)AI識(shí)別結(jié)果比對(duì)與優(yōu)選需建立一套針對(duì)兩套OCR識(shí)別結(jié)果的自動(dòng)化比對(duì)機(jī)制。當(dāng)兩套服務(wù)輸出的內(nèi)容不一致時(shí),系統(tǒng)應(yīng)能根據(jù)預(yù)設(shè)的置信度評(píng)估或規(guī)則集,自動(dòng)選擇更優(yōu)的識(shí)別結(jié)果;對(duì)于系統(tǒng)無法自動(dòng)判斷的差異項(xiàng),應(yīng)能生成待辦任務(wù)并將其推送至人工進(jìn)行最終確認(rèn)。3系統(tǒng)集成(1)知識(shí)平臺(tái)接口開發(fā)要求開發(fā)專用的數(shù)據(jù)接口,實(shí)現(xiàn)本項(xiàng)目與客戶現(xiàn)有知識(shí)生產(chǎn)平臺(tái)的穩(wěn)定對(duì)接。該接口需能夠?qū)⒆罱K確認(rèn)的結(jié)構(gòu)化數(shù)據(jù)(包括類別、名稱、內(nèi)容等字段)準(zhǔn)確、實(shí)時(shí)地推送至知識(shí)生產(chǎn)平臺(tái)的標(biāo)簽管理模塊,完成數(shù)據(jù)流轉(zhuǎn)的閉環(huán)。(2)人工復(fù)核功能需提供一個(gè)簡(jiǎn)潔有效的人工復(fù)核操作界面。該界面應(yīng)能清晰地展示由系統(tǒng)推送的、存在識(shí)別差異的文本內(nèi)容對(duì),并提供便捷的編輯、選擇和確認(rèn)功能,支持操作人員高效地完成人工校對(duì)與決策,并將確認(rèn)后的結(jié)果提交至后續(xù)處理流程。4運(yùn)行環(huán)境要求供應(yīng)商以服務(wù)租用的形式,提供一臺(tái)滿足本地化OCR服務(wù)運(yùn)行要求的高性能運(yùn)算主機(jī)。該主機(jī)需具備支撐兩套OCR服務(wù)并行處理任務(wù)所需的計(jì)算、存儲(chǔ)及內(nèi)存資源,并確保其在項(xiàng)目周期內(nèi)的穩(wěn)定運(yùn)行。相關(guān)服務(wù)費(fèi)用應(yīng)包含主機(jī)的配置、維護(hù)及技術(shù)支持。四、其他需求說明41運(yùn)行環(huán)境及網(wǎng)絡(luò)處理器:24GHz*4Core以上內(nèi)存:16GB以上
城維計(jì)劃-景區(qū)日常綠化養(yǎng)護(hù)經(jīng)費(fèi)結(jié)果公告-中標(biāo)公告.pdf
城維計(jì)劃-景區(qū)日常綠化養(yǎng)護(hù)經(jīng)費(fèi)結(jié)果公告-中標(biāo)公告.pdf
廣州市天河區(qū)住房建設(shè)和園林局2023-2025年天河濕地公園環(huán)衛(wèi)保潔服務(wù)項(xiàng)目合同延期補(bǔ)充協(xié)議的合同公告.pdf
廣州市天河區(qū)住房建設(shè)和園林局2023-2025年天河濕地公園環(huán)衛(wèi)保潔服務(wù)項(xiàng)目合同延期補(bǔ)充協(xié)議的合同公告.pdf
廣園快速路一、二、三期日常養(yǎng)護(hù)監(jiān)理(2026年度)招標(biāo)公告.pdf
廣園快速路一、二、三期日常養(yǎng)護(hù)監(jiān)理(2026年度)招標(biāo)公告.pdf
廣園快速路一、二、三期日常養(yǎng)護(hù)監(jiān)理(2026年度)招標(biāo)公告文件.zip
2026年飛機(jī)人工影響天氣作業(yè)服務(wù)項(xiàng)目采購更正公告(第一次)文件.zip
2026年飛機(jī)人工影響天氣作業(yè)服務(wù)項(xiàng)目采購更正公告(第一次)文件.zip
城維計(jì)劃-景區(qū)日?;A(chǔ)設(shè)施維護(hù)及環(huán)境綜合整治經(jīng)費(fèi)結(jié)果公告-中標(biāo)公告.pdf