一级中文字幕乱码免费_最近最新中文字幕高清_综合图区少妇熟女_成人黄色片免费观看_91免费福利精品国产_加勒比av在线播放_2020国内自拍视频_国产黄色毛片一级_日韩欧美性爱网址大全_aⅤ电影中文一区

?
公司新聞
當前位置: 首頁 > 新聞中心 > 公司新聞 > 干貨丨AI在數(shù)據(jù)防泄漏中的應用--知識圖譜之知識抽取 返回
干貨丨AI在數(shù)據(jù)防泄漏中的應用--知識圖譜之知識抽取
發(fā)布時間:2020-09-15 打印 字號:


隨著技術的不斷發(fā)展,AI(Artificial Intelligence,人工智能)逐漸在社會經(jīng)濟發(fā)展的方方面面深入,成為信息化時代最重要的支柱技術之一。

在數(shù)據(jù)安全領域領域,AI技術所能起到的作用越來越大,如針對數(shù)據(jù)防泄漏,運用知識圖譜技術可以使數(shù)據(jù)實現(xiàn)結構化,減少人為性工作,從而讓數(shù)據(jù)治理工作趨向智能化,提升工作效率。



在之前的文章中,明朝萬達數(shù)據(jù)安全專家已經(jīng)就“何為 AI在數(shù)據(jù)防泄漏中的應用--知識圖譜”做了詳細的介紹。之后我們也將以系列文章形式為大家分享“知識抽取”、“知識融合”、“知識推理”、“知識運用”的相關知識,大家一同探討,深入了解。


 知識圖譜之知識抽取 

知識抽取是指從不同來源、不同結構的數(shù)據(jù)中進行知識提取,提取出數(shù)據(jù)內(nèi)涵的事實性信息并供給知識圖譜做進一步加工處理后會形成知識,存入到知識圖譜。
知識抽取需處理的數(shù)據(jù)為多源異構數(shù)據(jù),一般包括非結構化數(shù)據(jù)、半結構化數(shù)據(jù)和結構化數(shù)據(jù),其相應的知識抽取的方法和技術各不相同。

△多元異構數(shù)據(jù)與對應知識抽取技術


★ 從非結構化中獲取知識用信息抽取,其難點在于結果的準確率與覆蓋率;
★ 從半結構化數(shù)據(jù)中獲取知識用包裝器,難點在于包裝器的自動生成、更新和維護;
★ 從結構化數(shù)據(jù)中獲取知識用 D2R,其難點在于復雜表數(shù)據(jù)的處理,包括嵌套表、多列、外鍵關聯(lián)等;
★ 從鏈接數(shù)據(jù)中獲取知識用圖映射,難點在于數(shù)據(jù)對齊。


知識抽?。悍墙Y構化數(shù)據(jù)

面向非結構化數(shù)據(jù)的知識抽取使用信息抽取技術解決,信息抽取包括命名實體識別、關系識別、共指消歧、事件抽取及模板填充五個任務,其流程如下圖所示:





知識抽?。喊虢Y構化數(shù)據(jù)

半結構化數(shù)據(jù)是指類似于百科、商品列表等本身存在一定結構但需要進一步提取整理的數(shù)據(jù)。面向半結構化的知識抽取使用包裝器實現(xiàn),其基本流程如下:

知識抽取:結構化數(shù)據(jù)

結構化數(shù)據(jù)就是指類似于關系庫中表格形式的數(shù)據(jù),該類數(shù)據(jù)往往在各項之間存在明確的關系名稱和對應關系。因此可以簡單的將其轉化為RDF或其他形式的知識庫內(nèi)容。
關于知識抽取,一種常用的W3C推薦的映射語言是R2RML(RDB2RDF),其映射結果如下:
1、數(shù)據(jù)庫表t_student結構



2、按照R2RML語言映射成RDF三元組知識結構



以及,現(xiàn)有的工具免費的有D2RQ,Virtuoso、MOrph等。


分享到:

400-650-8968