当前位置: 首页 > 软件库 > 其他开源 > 开源图书 >

nutcher

Nutch中文教程
授权协议 GPL
开发语言
所属分类 其他开源、 开源图书
软件类型 开源软件
地区 国产
投 递 者 屠盛
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

nutcher 是 Apache Nutch 的中文教程,在github上托管。nutch社区目前缺少教程和文档,而且教程对应版本号较为落后。nutcher致力于为nutch提供一个较新的中文教程和文档,供开发者学习。

github地址:

https://github.com/CrawlScript/nutcher


目录:




文档截图:

  • 教程不断更新中: Nutch的正则表达式配置(regex-urlfilter.txt) Nutch教程——URLNormalizer源码详解 Nutch流程控制源码详解(bin/crawl中文注释版) Nutch教程——导入Nutch工程,执行完整爬取 在windows上配置hbase Nutch的定位

 相关资料
  • 本章节会引导开发者快速搭建 dva 项目,并熟悉他的所有概念。 最终效果: 这是一个测试鼠标点击速度的 App,记录 1 秒内用户能最多点几次。顶部的 Highest Record 纪录最高速度;中间的是当前速度,给予即时反馈,让用户更有参与感;下方是供点击的按钮。 看到这个需求,我们可能会想: 该如何创建应用? 创建完后,该如何一步步组织代码? 开发完后,该如何构建、部署和发布? 在代码组织部分

  • 本书以简洁醒目的方式向读者介绍了Perl语言的基础内容,从书中读者可以获得丰富的、日常编程所需的Perl 5信息。

  • DirectX 是由微软公司创建的多媒体编程接口,是一种应用程序接口(API)。DirectX可让以windows为平台的游戏或多媒体程序获得更高的执行效率,加强3D图形和声音效果,并提供设计人员一个共同的硬件驱动标准,让游戏开发者不必为每一品牌的硬件来写不同的驱动程序,也降低用户安装及设置硬件的复杂度。

  • Ionic 是一个用来开发混合手机应用的,开源的,免费的代码库。可以优化 html、css 和 js 的性能,构建高效的应用程序,而且还可以用于构建 Sass 和 AngularJS 的优化。

  • RxJS 是 Reactive Extensions for JavaScript 的缩写,起源于 Reactive Extensions,是一个基于可观测数据流在异步编程应用中的库。RxJS 是 Reactive Extensions 在 JavaScript 上的实现。 一般说到RxJS,都会讲他是基于流的响应式的结合观察者和迭代器模式的一种库。

  • PyQt5中文教程,翻译自 zetcode,项目地址:https://github.com/maicss/PyQt5-Chinese-tutoral 这个教程比较好的地方是,能讲解每一段代码的含义。 虽然PyQt的函数命名已经非常语义化了,但是对于新手来说,有这一步还是更好的。 所以我选择了翻译这篇教程,希望能给刚入门的你带来帮助。

  • OpenGL 是用于渲染2D、3D矢量图形的跨语言、跨平台的应用程序编程接口(API)。这个接口由近350个不同的函数调用组成,用来绘制从简单的图形比特到复杂的三维景象。而另一种程序接口系统是仅用于Microsoft Windows上的Direct3D。OpenGL常用于CAD、虚拟现实、科学可视化程序和电子游戏开发。

  • Vuex 是一个专门为 Vue.js 应用设计的 状态管理模型 + 库。它为应用内的所有组件提供集中式存储服务,其中的规则确保状态只能按预期方式变更。它可以与 Vue 官方开发工具扩展(devtools extension) 集成,提供高级特征,比如 零配置时空旅行般(基于时间轴)调试,以及状态快照 导出/导入。