是山寨化 VeryCD 的全套工具,包括抓取脚本,网站代码等
想保存 VeryCD 链接资源者:别镜像 VeryCD 了,用这个吧。
想研究爬虫脚本和 python 语法者:其实写得挺烂的,勉强能用而已。
想研究 web.py+sqlite3 网站架设的爱好者:说学习是抬举我了,一周以前我也既不懂 web.py 又不懂 sql 数据库。
想测试自己虚拟主机性能者:没错,毕竟是1G 的数 据库,能跑而且能跑得顺畅的均非等闲主机
simplecd 架设完毕的例子:http://www.simplecd.org
抓网站用的是 python,用 python 系的框架能更好的整合
比较了一下 django 和 web.py,更喜欢 web.py 那种“用 python 写网站”,而不是 django 那 种“用 django 写网站”的风格。
最开始是因为 python 自带,简单易用
现在是因为实际表现比 mysql 好10倍:http://obmem.com/?p=317
sqlite 的弱点是高并发可能会锁死数据库,但是我已经找到解决方案,就是等什么时候有空研究一下怎么写代码。
我的个人主页,有源码的实现细节,欢迎来踩:http://obmem.com
博客中 VeryCD 相关: http://obmem.com/?tag=verycd
更直观的架设攻略请参考视频: http://www.simplecd.org/static/tutorial.html
所有可以架设 web.py 的地方,例如:
一个 VPS(Virtual Dedicated Server)(参考 Xen 和 OpenVZ 测试(附 VPS 推荐))
一 个支持 web.py 的国外共享主机(例如 dreamhost 架设 web.py 攻略)
一个支持 web.py 的国内共享主机(例如 stdyun.com 架设 web.py 攻略)
推荐配置:
Xen VPS 需要至少768MB内存的Linux VPS
OpenVZ VPS 需要Burstable内存至少512MB内存的Linux VPS,基本内存可以小一点没问题。
内 存太少的解决方法:
修改nginx/spawn-fcgi.sh中"-F 2"改为"-F 1",只使用一个守护进程
重 新写一个资源占用较低的框架来存取sqlite3。sqlite3直接存取占内存不大。
不要试图 用mysql来取代sqlite,mysql效率更低
本教程基于操作系统Ubuntu 9.04 由于玩VPS的都非善类,相信其他操作系统的架设都能自己解决
我们要用新软件,所以直接修改/etc/apt/sources.list 把其中的jaunty改为karmic,用9.10的软件源 :)
然后更新一下
apt-get update
接下来分别安装nginx,spawn-fcgi,和mercurial
apt-get install nginx apt-get install spawn-fcgi apt-get install mercurial
再接下来是easy_install的安装,以及安装web.py和flup
apt-get install python-setuptools easy_install web.py easy_install flup
下载源码
cd /var/www hg clone https://simplecd.googlecode.com/hg simplecd cd simplecd hg update deployment
接下来做一些基本的配置
#创建数据库 ./fetchvc.py createdb #nginx的配置文件(请根据视频进行相应修改) cp nginx/nginx.conf /etc/nginx/ cp nginx/simplecd /etc/nginx/site-available/ ln -s /etc/nginx/site-available/simplecd /etc/nginx/site-enabled/simplecd #用spawn-fcgi开fcgi nginx/spawn-fcgi.sh #开启nginx服务 /etc/init.d/nginx start
好了,大功告成,访问vps的地址看看,应该已经架设完毕了
上一步中的数据库还是空的,必须下载数据库,数据库更新方法如下
./fetchvc.py feed #按照feed更新数据库 ./fetchvc.py update #更新主页的前20页数据 ./fetchvc.py fetch q=海猫 #在verycd搜索所有关于海猫的内容并更新到数据库 ./fetchvc.py fetch TopicID #直接更新topicid ./fetchvc.py fetchall #更新全部数据库,建议还是不要尝试为好 ./fetchvc.py fetch 1000-1001 #更新verycd的archives页面第1000页到1001页的内容
eMule链接:
ed2k://%7Cfile%7Cverycd.sqlite3.db.lzma%7C233121378%7C0fd38cff1353e996576f9f3e9b8c65dd%7C
解压: lzma -d verycd.sqlite3.db.lzma
然后放入 simplecd目录即可
想让simplecd自动和VeryCD保持同步?
试试看 default branch的scdd.py:
hg update default python scdd.py start
每隔15分钟看一下,如果成功的话应该已经有自动更新了
simplecd.org上有 些特殊的设置,所以我没有让它与本源代码同步,而是同步到另一个目录,作出一些调整,然后复制到目标目录。
要尝试新界面和新功能你可以试试看dev branch:
hg update dev
注意:最新的dev branch使用了mysql数据库,sqlite到mysql的转换可见conf.py的注释部分。
注意2*:mysql性能可能会极烂,如果有2G 以上内存那么可以考虑修改my.cnf至它默认的huge站的配置文件
SimpleCD是什么? 是山寨化VeryCD的全套工具,包括抓取脚本,网站代码等 谁需要使用SimpleCD? 想保存VeryCD链接资源者:别镜像VeryCD了,用这个吧。 想研究爬虫脚本和python语法者:其实写得挺烂的,勉强能用而已。 想研究web.py+sqlite3网站架设的爱好者:说学习是抬举我了,一周以前我也既不懂web.py 又不懂sql数据库。 想测试自己虚拟主机性能者:没错
很多网站的特殊功能似乎只是支持IE的,比如那个什么一键全部下载,还有比如12306,还有比如。。。。。。。。。。。。。。。。 不要忘记IE 暑假的时候装系统误装了Windows Visita 确实有点卡,这个与windows 7其实感觉是差不多的
http://code.google.com/p/simplecd/
源码: http://code.google.com/p/simplecd/ 可以尝试着学习学习。 附介绍: ------------------------------------------------------------------------------------ SimpleCD桌面版源代码 ==================== SS.py是主程序,直接执行即可 依赖:
当BT网站纷纷被关整顿的时候,当veryCD让我们一惊一乍暗自庆幸的时候,近日有人为广大爱好自由的emule分享者制作了一个“山寨verycd”网站SimpleCD,延续着emule们自由分享精神的本源。 ======================================================== 发布感言: 经过一周时间的编写和调试,现在山寨版VeryCD网站终于已经符合我的
本文向大家介绍PHP实现C#山寨ArrayList的方法,包括了PHP实现C#山寨ArrayList的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了PHP实现C#山寨ArrayList的方法。分享给大家供大家参考。具体如下: 希望本文所述对大家的php程序设计有所帮助。
ChatGPT的爆火让所有人都始料未及。已跟进的国内互联网大厂中,不乏百度、阿里、京东等传统互联网大厂,商汤科技、科大讯飞等知名AI科技公司也参与其中;不仅如此,退居幕后多年的互联网风云人物李开复、王惠文、王小川等人也争相成立新公司。
还记得约一面时就很坎坷了,当时金山打了几个电话我都阴差阳错地没有接到,还想着错过就错过了吧,后面国庆后又给我打了电话,感动+1。之后便是等待一面,还记得一面前一晚上到2点左右才睡着。金山的面试官都很好,一面安慰我让我不要紧张。在我秋招低谷的时候给我发了二面通知,感动+1;二面面试官给我讲学生进入职场的注意事项,指出我存在的问题,感动+1。二面后一直没有消息,慌得很,还好看到牛客其他bro主动去催,
香山是一款开源的高性能 RISC-V 处理器,基于 Chisel 硬件设计语言实现,支持 RV64GC 指令集。 在香山处理器的开发过程中,其团队使用了包括 Chisel、Verilator 等在内的大量开源工具,实现了差分验证、仿真快照、RISC-V 检查点等处理器开发的基础工具,建立起了一套包含设计、实现、验证等在内的基于开源工具的处理器前端敏捷开发流程。 示例视频 香山的架构代号以湖命名。第
感觉十分友好哇,没啥技术问题,因为都是Java岗,楼主Java没啥基础,知道我是数据科学与大数据技术专业后问你觉得大数据是什么,5V特点,你认为大数据满足几个V就可以还是必须满足5V,大数据在生活中不同领域的应用有哪些,然后又问面了哪几个公司了,我说鼎信,牵扯到一点嵌入式,在产品上开发,然后问你觉得开发到产品上跟自己在电脑上写哪个更符合你的人生价值。。。大部分都是聊家常,问大学里你觉得最困难的是什
bg双非本,Java选手,明确需要转码golong,实习ing中投递 笔试:基础题40分,考差的golong,Java技术栈做出来了大部分,算法题三道,60分,ak了,隔天状态变为用人部门筛选,一周约面 服务端一面 近1h 常规八股+八股底层(大概20分钟) 项目理解+sql场景+业务设计(40分钟) 反问流程:3-5天会有结果 面完大概30分钟,电话约了隔天的二面,推掉了 服务端二面 50min