Searx是一个免费的互联网元搜索引擎,汇集了70多种搜索服务的结果。 用户既不被跟踪也不被分析。 此外,searx可以在Tor上实现在线匿名搜索。
下面是基于 Debian/Ubuntu 和 virtualenv 的安装指南,如果是 Ubuntu 请确认使用的是 universe 仓库。
安装依赖包:
sudo apt-get install git build-essential libxslt-dev python-dev python-virtualenv python-babel zlib1g-dev libffi-dev libssl-dev
安装 searx:
cd /usr/local sudo git clone https://github.com/asciimoo/searx.git sudo useradd searx -d /usr/local/searx sudo chown searx:searx -R /usr/local/searx
在 virtualenv 中安装依赖:
sudo -u searx -i cd /usr/local/searx virtualenv searx-ve . ./searx-ve/bin/activate ./manage.sh update_packages
sed -i -e "s/ultrasecretkey/`openssl rand -hex 16`/g" searx/settings.yml
根据需要修改 searx/settings.yml
启动 searx:
python searx/webapp.py
浏览器访问 http://localhost:8888
如果一切工作正常,可以在 settings.yml 中禁用调试选项:
sed -i -e "s/debug : True/debug : False/g" searx/settings.yml
安装依赖包
sudo apt-get install uwsgi uwsgi-plugin-python
创建配置文件 /etc/uwsgi/apps-available/searx.ini,内容如下:
[uwsgi] # Who will run the code uid = searx gid = searx # disable logging for privacy disable-logging = true # Number of workers (usually CPU count) workers = 4 # The right granted on the created socket chmod-socket = 666 # Plugin to use and interpretor config single-interpreter = true master = true plugin = python lazy-apps = true enable-threads = true # Module to import module = searx.webapp # Virtualenv and python path virtualenv = /usr/local/searx/searx-ve/ pythonpath = /usr/local/searx/ chdir = /usr/local/searx/searx/
激活 uwsgi 应用并重启
cd /etc/uwsgi/apps-enabled ln -s ../apps-available/searx.ini /etc/init.d/uwsgi restart
使用如下命令安装 Nginx
sudo apt-get install nginx
创建配置文件 /etc/nginx/sites-available/searx 内容如下:
server { listen 80; server_name searx.example.com; root /usr/local/searx; location / { include uwsgi_params; uwsgi_pass unix:/run/uwsgi/app/searx/socket; } }
重启服务:
sudo service nginx restart sudo service uwsgi restart
添加配置文件 /etc/nginx/sites-enabled/default 内容如下:
location = /searx { rewrite ^ /searx/; } location /searx { try_files $uri @searx; } location @searx { uwsgi_param SCRIPT_NAME /searx; include uwsgi_params; uwsgi_modifier1 30; uwsgi_pass unix:/run/uwsgi/app/searx/socket; }
或者使用反向代理(适合单用户使用或者低访问量的实例)
location /searx { proxy_pass http://127.0.0.1:8888; proxy_set_header Host $host; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Scheme $scheme; proxy_set_header X-Script-Name /searx; proxy_buffering off; }
编辑 searx/settings.xml 中的 base_url
base_url : http://your.domain.tld/searx/
重启服务:
sudo service nginx restart sudo service uwsgi restart
为了更好的保护隐私,可以禁用日志,在 /etc/nginx/sites-available/default 的 uwsgi_pass
下面增加如下内容:
access_log /dev/null; error_log /dev/null;
重启服务
sudo service nginx restart
增加 wsgi mod:
sudo apt-get install libapache2-mod-uwsgi sudo a2enmod uwsgi
增加配置内容到 /etc/apache2/apache2.conf:
<Location /> Options FollowSymLinks Indexes SetHandler uwsgi-handler uWSGISocket /run/uwsgi/app/searx/socket </Location>
N注意,如果你的 searx 实例不是部署在根路径,需要修改 <Location />
配置信息,如 <Location /searx>
.
重启 Apache:
sudo /etc/init.d/apache2 restart
回到配置文件 /etc/apache2/apache2.conf 在 <Location />
指令上方增加:
CustomLog /dev/null combined
重启 Apache:
sudo /etc/init.d/apache2 restart
cd /usr/local/searx sudo -u searx -i . ./searx-ve/bin/activate git stash git pull origin master git stash apply ./manage.sh update_packages sudo service uwsgi restart
确认你已装有 Docker ,然后使用如下命令来部署 searx:
docker pull wonderfall/searx docker run -d --name searx -p $PORT:8888 wonderfall/searx
打开浏览器访问 http://localhost:$PORT.
更多的帮助请看 https://hub.docker.com/r/wonderfall/searx/
你也可以通过 Dockerfile 来构建 searx
git clone https://github.com/asciimoo/searx.git cd searx docker build -t whatever/searx .
- https://about.okhin.fr/posts/Searx/ with some additions
- How to: Setup searx in a couple of hours with a free SSL certificate
每次使用百度搜索,前面几条永远是广告,甚至还有“假官网”“假医院”,搞得每次都得甄别有没有带“广告”标,再点进去,所以有用的信息没找到,时间到是浪费了不少。所以我就想自己建个无广告、不追踪隐私的搜索引擎,当然重新开发是不可能的,所幸在github找到了个聚合搜索神器——SearX 软件介绍 Searx是一个免费的互联网元搜索引擎,汇集了70多种搜索服务的结果。 用户既不被跟踪也不被分析。 此外,s
软件简介 Searx是一个免费的互联网元搜索引擎,汇集了70多种搜索服务的结果。 用户既不被跟踪也不被分析。 此外,searx可以在Tor上实现在线匿名搜索。 基本安装 下面是基于 Debian/Ubuntu 和 virtualenv 的安装指南,如果是 Ubuntu 请确认使用的是 universe 仓库。 安装依赖包: sudo apt-get install git build-essent
元搜索引擎 原搜索引擎是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。 自己没搜索引擎,又想要大规模的数据源,怎么办?可以对百度搜索和谷歌搜索善加利用,以小搏大,站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索和谷歌搜索来实现,比如网站的新闻采集,比如技术、品牌的新闻跟踪,比如知识库的收集,比如人机问答系
我对这家公司有着先入为主的厌恶滤镜,这源自自己作为消费者的直接评价、作为社会人的责任使然;此外,作为学生在与从基层到中层员工、从职能到业务人员的交流接触中,更加加深了这层滤镜。但需要说明的是,我十分幸运——最后遇到了很棒的老板和同事,让我出乎意料;奇葩的面试流程让我对面试有了更深刻的理解。 最后拿到offer对应的组真的挺棒的。做的事情算得上核心,也能发挥自己的特长,面试官/团队有技术,不过分卷;
搜索引擎分为两部分: 时间筛选 和 搜索引擎 (详情) 1.时间筛选 便捷按钮有今日、昨日、前日、上周 X、近七天,并且能自定义选择时间段来得出想要的结果报表 2.搜索引擎 (时间段详情) 选择日期,查看来自对应时间段内,各个搜索引擎的访问量比例
我有大量相同类型的实体,每个实体都有大量属性,并且我只有以下两种选择来存储它们: 将每个项存储在索引中并执行多索引搜索 将所有enties存储在单个索引中,并且只搜索1个索引。 一般而言,我想要一个时间复杂度之间的比较搜索“N”实体与“M”特征在上述每一种情况!
Eclipse搜索引擎网页应用接口(web-eclipse-textsearch) 用点击WEB超链接搜索,来替代通常地靠按Ctrl+H键来手动查找的插件技术。 程序员在查找曾经开发过的类似模块的一些技术(程序员经常这样做)时,将变得更为直接,因为所有曾经查询过的关键字都以超链接地形式存储在网页中。 Test.html点击的超链接代码 html超链接代码:向插件内置服务 2014 socket端口
lucene 和 es 的前世今生 lucene 是最先进、功能最强大的搜索库。如果直接基于 lucene 开发,非常复杂,即便写一些简单的功能,也要写大量的 Java 代码,需要深入理解原理。 elasticsearch 基于 lucene,隐藏了 lucene 的复杂性,提供了简单易用的 restful api / Java api 接口(另外还有其他语言的 api 接口)。 分布式的文档存储