• <rt id="sjylx"><kbd id="sjylx"></kbd></rt>
    Title
    業(yè)務(wù)咨詢
    聯(lián)系電話
    400-600-7966
    企業(yè)微信
    掃碼咨詢

    當(dāng)大模型學(xué)會「讀表格」:智能問答如何破解數(shù)據(jù)結(jié)構(gòu)化難題?

    2025-05-22 21:58:52   來源: 本站原創(chuàng) 

    Gartner最新研究指出,2025年企業(yè)業(yè)務(wù)數(shù)據(jù)中超60%將依賴表格存儲。這意味著表格已經(jīng)成為企業(yè)管理知識的重要方式,遠(yuǎn)遠(yuǎn)超過了傳統(tǒng)的文本形式。其結(jié)構(gòu)化特性帶來的信息密度與交互效率,使得表格問答在智能問答領(lǐng)域的地位愈發(fā)關(guān)鍵。

    表格問答難在哪?

    可別小看表格問答,它的難度可不低。和普通文本相比,表格就像個(gè)復(fù)雜的謎題。

    結(jié)構(gòu)復(fù)雜:普通文本是“一行到底”的簡單結(jié)構(gòu),模型順著讀就能明白意思。但表格是二維的,單元格合并、跨行跨列這些情況太常見了,信息就像被打散的拼圖,找起來特別費(fèi)勁。

    語義難解:在理解語義方面,普通文本的關(guān)鍵信息一目了然,像“2025年一季度A產(chǎn)品銷售額100萬”,誰都能看懂。但表格得靠表頭才能知道數(shù)據(jù)是什么意思,有些表格還有多級表頭、跨列跨行表頭,信息又多又復(fù)雜,邏輯都藏在表格結(jié)構(gòu)里。

    解析邏輯:以前解析表格主要靠單元格的顏色、填充這些視覺標(biāo)記來識別表頭,可要是遇到黑白文檔、掃描件,或者沒有這些標(biāo)記的表格,就沒辦法了。

    表格存儲示意

    自研表格理解增強(qiáng)技術(shù)

    不過別擔(dān)心,金現(xiàn)代團(tuán)隊(duì)?wèi){借強(qiáng)大的技術(shù)實(shí)力,研發(fā)出了基于類 HTML 解析語法的表格理解增強(qiáng)技術(shù),能讓大模型更準(zhǔn)確地理解表格數(shù)據(jù)。實(shí)現(xiàn)過程主要有下面6步:

    獲取信息:獲取不同格式知識文檔中的文本信息和表格信息。

    統(tǒng)一格式:將表格信息轉(zhuǎn)換為統(tǒng)一的存儲格式,并定義基于行和列的存儲格式。

    確定表頭區(qū)域:根據(jù)表格中形成表頭的位置規(guī)律,確定表頭大致區(qū)域。

    詳細(xì)表頭區(qū)域:將確定的表頭大致區(qū)域的文字內(nèi)容拼接,采用預(yù)訓(xùn)練語言模型,對拼接后的內(nèi)容進(jìn)行分類,確定表格所屬類別,進(jìn)而確定表頭詳細(xì)區(qū)域。

    處理表格內(nèi)容:根據(jù)確定的表頭詳細(xì)區(qū)域,以表頭為基準(zhǔn),對表格其余部分進(jìn)行單元格合并或拆分,得到單元格無合并的情況且每行列數(shù)相同、每列行數(shù)相同的表格內(nèi)容。

    存儲表格知識:以表頭單元格的文字內(nèi)容為字段名,對應(yīng)的列或行中的單元格文字內(nèi)容為值,將表格內(nèi)容轉(zhuǎn)換為鍵值對的形式,將原本表格中的一行或一列編為一組鍵值對字符串,向量化后存入向量庫中。

    經(jīng)過這6步的處理,就像給表格來了一場 "結(jié)構(gòu)化改造",最終把復(fù)雜表格變成機(jī)器能看懂的 "鍵值對",再亂的表格數(shù)據(jù)都能乖乖 "對號入座",讓大模型理解表格就像讀普通文字一樣簡單。

    表格問答優(yōu)勢,賦能行業(yè)應(yīng)用

    憑借在表格問答領(lǐng)域的技術(shù)突破,金現(xiàn)代智能問答系統(tǒng)構(gòu)建了兼具創(chuàng)新性與實(shí)用性的知識服務(wù)體系。系統(tǒng)可針對檢測標(biāo)準(zhǔn)、設(shè)備說明書等非結(jié)構(gòu)化文檔提供精準(zhǔn)問答服務(wù),更能在批量復(fù)雜表格處理場景中展現(xiàn)強(qiáng)大性能,為企業(yè)決策提供支撐,推動(dòng)知識管理向自動(dòng)化、智能化層級躍遷。

    表格問答示意

    金現(xiàn)代將持續(xù)聚焦技術(shù)迭代與場景創(chuàng)新,不斷提升系統(tǒng)的智能解析精度與服務(wù)響應(yīng)效率,致力于在智能問答領(lǐng)域構(gòu)建更具深度與廣度的解決方案,助力企業(yè)釋放數(shù)據(jù)價(jià)值,開創(chuàng)智能知識管理新范式。


    • <rt id="sjylx"><kbd id="sjylx"></kbd></rt>
      日韩午夜福利在线观看 | 久久人人草 | 破瓜强制受孕龙精h | 大鸡吧操小骚逼视频 | 成人黄色视频网站 | 五月婷婷丁香六月 | 一区二区成人片18 | 男的操女的免费视频 | 无码精品人妻一区二区三区漫画 | freehd18麻豆 |