欢迎来到 常识词典网 , 一个专业的常识知识学习网站!

[ Ctrl + D 键 ]收藏本站

您所在的位置:首页 > 教育学习 > 百科

百科

如何获得一些比较全的公有数据?

分类: 百科 常识词典 编辑 : 常识 发布 : 08-25

阅读 :241

如何获得一些比较全的公有数据?就是想了解下,我们一般获取一些数据有那些方法,比如我需要某个行业的企业的名单 ,不需要电话号码什么的隐私信息,但是互联网上的信息杂而全,自己归纳工作量太大,有没有什么简单的方法得到这些数据呢?1 个答案

答案 1:

先具體的回答如何得到「某个行业的企业的名单」:

維基百科 API

例:-/w/api...中國製造公司&cmlimit=500&for-t=json (中國製造公司的名單)例:en.-.org/w/api... (中國的互聯網公司,雖然是英文的)詳細請參考[1]

Freebase API

例:-ttps://api.freebase/api/servic...{%22query%22:[{%22type%22:%22/organization/organization%22,%22also:type%22:%22/business/business_operation%22,%22name%22:null,%22/business/business_operation/industry%22:%22Manufacturing%22,%22-eadquarters%22:[{%22citytown%22:{%22type%22:%22/location/location%22,%22containedby%22:[{%22name%22:%22C-ina%22}]}}]}]} (中國製造公司)它或了一個叫做 MQL 的頗為複雜的查找語言,上面用到的 MQL 是:[{"type": "/organization/organization", "also:type": "/business/business_operation", "name": null, "/business/business_operation/industry": "Manufacturing", "-eadquarters": [ {"citytown": { "type": "/location/location", "containedby": [ {"name": "C-ina" }]}}]}]雖然複雜,但是改改參數就可以做各種變化,而維基 API 能查到的東西就與有沒有某個分類有很大的關係,MQL 的詳細說明請參考[2]。這些資料,雖然理論上都可以從各個公有地方找到,但是實際上 Freebase 跟維基都是由人力辛苦建立起來的資料庫,透過一筆一筆資料輸入進去,所以也等於是使用別人歸納的結果,而中文相關的資料不夠也是跟使用維基跟 Freebase 的中文朋友不夠有直接的關係。語意網是一個所有網站都主動放置元數據,靠網路蜘蛛就可以自動化建立這些資料庫的美好的社會理論。但是實際上每個做網頁的都懶,加上一些社會原因使得這個理想到目前為止還差很遠。靠自然語言處理建立這樣的資料庫似乎還不是很有希望的事。總之,這些是扯遠了。[1]mediawiki.org/wiki...[2]freebase/docs...

下一篇:NBA总决赛,小牛接下来的2场球,最需要的做的工作是? 下一篇 【方向键 ( → )下一篇】

上一篇:如何寻找创业机会 上一篇 【方向键 ( ← )上一篇】