最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

【整理】常见人名和地名的数据

数据 crifan 1393浏览 0评论
总结常见的人名+地名:
【关于数据源】
1.是用自己去从网上整理呢?
  • 优点:
    • 可以自己过滤和保留自己需要的数据
  • 缺点:
    • 需要一定的人工/脚本去处理
【常见姓名】
另外:
常见的名字:
【常见地名】
全部的:
2.还是想办法找已有的数据库?
比如Yago
Max-Planck-Institut für Informatik: Downloads
  • 缺点:
    • 太大了
      • 未压缩:170G
      • 压缩后:19G
    • 下载后再去如何合并和提取出我们要的数据
【关于人名和地名的存储格式】
1.保存地名时:
  • 除了保存地名之外,是否要保存相关的属性?比如某个城市名,所属的国家?(美国的哪个)州?等等
2.保存人名:
  • 是否只保存英语语系的名字?
    • 其他比如中文姓和名,是否保存?

常见人名地名
common person name and place
What are the ten most common person’s names on the internet? – Quora
Most Common Last Names in the U.S.
Most Popular Names
Most Common Last Names in the United States in 1990 | Infoplease
Nouns: Person, Place, Thing, Animal | Common Sense Education
  • Person
  • Place
  • Thing
  • Animal
Miscellaneous
https://www.infoplease.com/us/miscellaneous
Most Popular Baby Names by State, 2015
Most Popular Baby Names in the United Kingdom
common  place name
common place name of United kingdom
Most Common British Place Names (Ordnance Survey) | Alchemipedia
List of United Kingdom locations – Wikipedia
List of towns in the United Kingdom – Wikipedia
Lists of cities in Europe – Wikipedia

Yago
Max-Planck-Institut für Informatik: Demo
YAGO Svg Browser
Max-Planck-Institut für Informatik: Downloads
YAGO (database) – Wikipedia
https://en.wikipedia.org/wiki/YAGO_(database)
YAGO多语言知识库(包含中文) – 图谱 – 开放知识图谱
YAGO – Datasets – the Datahub
Max-Planck-Institut für Informatik: YAGO
https://github.com/yago-naga/yago3
下载:
Max-Planck-Institut für Informatik: Downloads
“Download the Entire YAGO
You can download the entire YAGO (version 3.1) ontology in one piece. The time stamps for different dumps are as follows:
* Wikipedia (en, de, nl, fr, it, es, pl, fa, ar, ro): 2017-05-20
* Geonames: 2017-06-18
* Wikidata: 2017-05-22
Links
Download YAGO ontology in .tsv format! (19 Gb compressed, 168 Gb uncompressed, without SPOTLX)
Download YAGO ontology in .ttl (turtle) format! (19 Gb compressed, 170 Gb uncompressed, without SPOTLX)
SPOTLX facts are available in an extra archive: ttl format / tsv format
Sample facts for popular entities: tsv format”
yago 数据库 人名 地名
yago 数据库
知识图谱+Recorder︱中文知识图谱API与工具、科研机构与算法框架 – CSDN博客
知识图谱的发展概述 | 机器之心

转载请注明:在路上 » 【整理】常见人名和地名的数据

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
80 queries in 0.205 seconds, using 22.19MB memory