github-wikidata-bot

授权协议 View license
开发语言 Python
所属分类 应用工具、 IM/聊天/语音工具
软件类型 开源软件
地区 不详
投 递 者 诸葛柏
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

GitHub to Wikidata bot

Tests

Update Wikidata entries using metadata from GitHub.

For free software projects with a GitHub repository listed in Wikidata,this script will perform the following steps,using metadata collected from the GitHub API:

  • Import all stable releases and the release dates, including release data, source, and a source title
  • Update the project website
  • Normalize the GitHub link

It is possible to exclude items from being edited by the bot, and also to allow using tags for projects without GitHub releases.

Setup and usage

First install python >=3.6 and poetry, then run poetry install.

Generate a personal access token on GitHub. Create a config.json file with that token and your Wikidata username:

{
  "username": "my-wikidata-username",
  "github-oauth-token": "abcdedf1234567"
}

Then run main.py in a terminal and enter the password for your bot account.

Run pytest and black . after making code changes.

Implementation notes

First, a SPARQL query gathers all the free software projects in Wikidatawhich have a GitHub repository specified in the source code repository property.For each entry, a cached request to the GitHub API is made,which is authenticated by the OAuth key.The wikidata entries are then inserted using a "exists or insert" logic.For each entry, the GitHub api link is added as reference.

Why does the bot not work for item Q…?

  • Does the entity already have a VCS repository set? Use this queryto determine entities without a repository.
  • You can check the logs.

Statistics

You can find detailed statistics on wmflabs.

  • 微信个人号似乎是按照web微信 的api接口做的 在github上找到的几个repo: perl: https://github.com/sjdy521/Mojo-Weixin python: https://github.com/littlecodersh/ItChat https://github.com/liuwons/wxBot https://github.com/Urinx/Weixi

  • 今天看一篇文章,上面有个链接。 看完后。。。 What。 他们竟然用github发表博客。 也是! README的Markdown语法本来就应用在其他博客书写工具里面了。 是我的世界观太窄了。 人家真的是利用github到极致。 论坛 资源帖 代码共享 博客 wiki 网站 。。。。。 而我!还停留在代码托管这个层面上。

  • 应用场景 ​ 在平台初期或者后期都需要一些标准的官方信息来填充平台缺乏的内容,以往可能是通过爬虫进行爬取,但是这块受限于一些法律或者内容的付费独家信息和内容准确性的问题。因此需要一种渠道拿到我们希望获取的各类数据,比如,城市信息、人物信息、书籍刊物、歌曲、电影等等。 ​ 这类信息最直接的方式就是维基百科,里面基本可以搜索到我们能获取的数据,因此我们就考虑怎么从维基百科拉取标准化数据。 数据研究 ​

 相关资料
  • 问题内容: 我正在尝试安装wikidata-query-rdf(https://github.com/wikimedia/wikidata-query- rdf ),并且Blazegraph失败: 我首先收到这种警告:[警告] com.blazegraph:bigdata- cache:jar:2.1.5-SNAPSHOT的POM丢失了,没有可用的依赖项信息 然后 : 问题答案: Maven无法找

  • 问题内容: 好的,所以我试图从Wikidata中获取有关电影的信息,以以下电影为例: https //www.wikidata.org/wiki/Q24871 在页面上,数据清楚地以可读格式显示,但是当您尝试通过API提取数据时,会得到以下信息:https : //www.wikidata.org/w/api.php?action=wbgetentities&ids=Q24871 这是其中的一部分

  • 所以现在我们已经介绍了 GitHub 的大部分功能与工作流程,但是任意一个小组或项目都会去自定义,因为他们想要创造或扩展想要整合的服务。 对我们来说很幸运的是,GitHub 在许多方面都真的很方便 Hack。 在本节中我们将会介绍如何使用 GitHub 钩子系统与 API 接口,使 GitHub 按照我们的设想来工作。 钩子 GitHub 仓库管理中的钩子与服务区块是 GitHub 与外部系统交互

  • 你可以在 Github 上为项目创建远程仓库。创建公开的远程仓库是免费的,私有仓库要收费。 任务 在 Github 网站申请一个帐号。 https://github.com 配置帐号的 ssh-key。 https://github.com/settings/keys ssh-key 在 Github 个人帐户里配置使用了 ssh-key,以后你往你的 Github 远程仓库推送的时候就不需要输入

  • 代码仓库 我们在GitHub上进行Tengine项目的开发:https://github.com/alibaba/tengine。 可以用git检出最新的Tengine代码: 参与开发 我们非常欢迎也很鼓励您在Tengine的项目的GitHub上报告issue或者pull request。 如果您还不熟悉GitHub的Fork and Pull开发模式,您可以阅读GitHub的文档(https:/

  • 类属性 $allowSignup 是否在登录页显示注册,默认false