在 Ubuntu Server 14.04 下安装中文全文搜索引擎 Coreseek 4.1-beta
在 Ubuntu Server 14.04 下安装中文全文搜索引擎 Coreseek 4.1-betaCoreseek 是一款可供企业使用的中文全文 “检索/搜索” 软件,以 GPL2 许可协议开源发布;基于 Sphinx 研发并独立发布,专攻中文搜索和信息处理领域。适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景,可以免费下载使用。商业使用(譬如:嵌入到其他程序中)需要获得商业授权。
Sphinx 是 SQL Phrase Index 的缩写,但不幸的是和 CMU 的 Sphinx 项目重名。
Coreseek 的意图:为其他应用提供高速、低空间占用、高相关度结果的中文全文搜索能力。CoreSeek 可以非常容易的与 SQL 数据库和脚本语言集成。
01、安装 Ubuntu Server 14.04 编译工具包
root:# apt-get install make gcc g++ automake libtool mysql-client libmysqlclient-dev libxml2-dev libexpat1-dev
#若数据库为 MariaDB
root:# apt-get install make gcc g++ automake libtool mariadb-client libmysqlclient-dev libxml2-dev libexpat1-dev
02、下载、解压 Coreseek 4.1-beta 安装包
root:# cd /var
root:/var# wget http://www.coreseek.cn/uploads/csft/4.0/coreseek-4.1-beta.tar.gz
--2015-01-03 04:00:39--http://www.coreseek.cn/uploads/csft/4.0/coreseek-4.1-beta.tar.gz
正在解析主机 www.coreseek.cn (www.coreseek.cn)... 219.234.93.160
正在连接 www.coreseek.cn (www.coreseek.cn)|219.234.93.160|:80... 已连接。
已发出 HTTP 请求,正在等待回应... 301 Moved Permanently
位置:http://219.232.239.243/uploads/csft/4.0/coreseek-4.1-beta.tar.gz [跟随至新的 URL]
--2015-01-03 04:00:39--http://219.232.239.243/uploads/csft/4.0/coreseek-4.1-beta.tar.gz
正在连接 219.232.239.243:80... 已连接。
已发出 HTTP 请求,正在等待回应... 200 OK
长度: 9157146 (8.7M)
正在保存至: “coreseek-4.1-beta.tar.gz”
100%[================================================================================>] 9,157,146 344KB/s 用时 27s
2015-01-03 04:01:07 (327 KB/s) - 已保存 “coreseek-4.1-beta.tar.gz” )
root:/var#tar zxvf coreseek-4.1-beta.tar.gz03、安装 mmseg-3.2.14 中文分词root:/var# cd /var/coreseek-4.1-beta/mmseg-3.2.14
root:/var/coreseek-4.1-beta/mmseg-3.2.14# ./bootstrap
root:/var/coreseek-4.1-beta/mmseg-3.2.14# ./configure --prefix=/usr/local/mmseg3 #配置 mmseg-3.2.14
root:/var/coreseek-4.1-beta/mmseg-3.2.14# make && make install #编译、安装 mmseg-3.2.1404、中文分词测试若显示乱码,请检查系统 locale 本地环境 zh_CN.UTF-8 设置root:/var/coreseek-4.1-beta/mmseg-3.2.14# /usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc /var/coreseek-4.1-beta/mmseg-3.2.14/src/t1.txt
中文/x 分/x 词/x 测试/x
中国人/x 上海市/x
Word Splite took: 0 ms.
root:/var/coreseek-4.1-beta/mmseg-3.2.14#05、安装 Coreseek-4.1-beta 搜索root:/var/coreseek-4.1-beta/mmseg-3.2.14# cd /var/coreseek-4.1-beta/csft-4.1
root:/var/coreseek-4.1-beta/csft-4.1# sh buildconf.sh
root:/var/coreseek-4.1-beta/csft-4.1# ./configure --prefix=/usr/local/coreseek --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql #配置 coreseek-4.1-beta
root:/var/coreseek-4.1-beta/csft-4.1# make && make install #编译、安装 mmseg-3.2.1406、测试 mmseg-3.2.14 中文分词,coreseek-4.1-beta 搜索root:/var/coreseek-4.1-beta/csft-4.1# cat /var/coreseek-4.1-beta/testpack/var/test/test.xml
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc /var/coreseek-4.1-beta/testpack/var/test/test.xml
</x ?/x xml/x/x version/x =/x "/x 1/x ./x 0/x "/x/x encoding/x =/x "/x utf/x -/x 8/x "/x ?/x >/x
</x sphinx/x :/x docset/x >/x
/x </x sphinx/x :/x schema/x >/x
/x </x sphinx/x :/x field/x/x name/x =/x "/x subject/x "/x //x >/x/x
/x </x sphinx/x :/x field/x/x name/x =/x "/x content/x "/x //x >/x
/x </x sphinx/x :/x attr/x/x name/x =/x "/x published/x "/x/x type/x =/x "/x timestamp/x "/x //x >/x
/x </x sphinx/x :/x attr/x/x name/x =/x "/x author/x _/x id/x "/x/x type/x =/x "/x int/x "/x/x bits/x =/x "/x 16/x "/x/x default/x =/x "/x 1/x "/x //x >/x
/x </x //x sphinx/x :/x schema/x >/x
/x </x sphinx/x :/x document/x/x id/x =/x "/x 1/x "/x >/x
/x /x </x subject/x >/x 愚人/x 节/x 最佳/x 蛊惑/x 爆/x 料/x/x 谷/x 歌/x 300/x 亿/x 美元/x 收购/x 百/x 度/x </x //x subject/x >/x
/x /x </x published/x >/x 1270131607/x </x //x published/x >/x
/x /x </x content/x >/x 据/x 国外/x 媒体/x 报道/x ,/x 谷/x 歌/x 将/x 巨资/x 收购/x 百/x 度/x ,/x 涉及/x 金额/x 高达/x 300/x 亿/x 美元/x 。/x 谷/x 歌/x 借/x 此/x 重返/x 大陆/x 市场/x 。/x
/x /x 该/x 报道/x 称/x ,/x 目前/x 谷/x 歌/x 与/x 百/x 度/x 已经/x 达成/x 了/x 收购/x 协议/x ,/x 将/x 择机/x 对外/x 公布/x 。/x 百/x 度/x 的/x 管理层/x 将/x 100/x %/x 保留/x ,/x 但/x 会/x 将/x 项目/x 缩减/x ,/x 包括/x 有/x 啊/x 商城/x ,/x 以及/x 目前/x 实施/x 不力/x 的/x 凤/x 巢/x 计划/x 。/x 正在/x 进行/x 测试/x 阶段/x 的/x 视频/x 网站/x qiyi/x ./x com/x 将/x 输入/x 更/x 多/x 的/x Youtube/x 资源/x 。/x (/x YouTube/x 在/x 大陆/x 区/x 因/x 内容/x 审查/x 暂/x 不/x 能/x 访问/x )/x 。/x
/x /x 该/x 消息/x 似乎/x 得到/x 了/x 谷/x 歌/x CEO/x 施/x 密/x 特/x 的/x 确认/x ,/x 在/x 其/x twitter/x 上/x 用/x 简短/x 而/x 暧昧/x 的/x 文字/x 进行/x 了/x 表述/x :/x “/x/x Withdraw/x/x from/x/x that/x/x market/x ?/x/x u/x '/x ll/x/x also/x/x see/x/x another/x/x result/x ,/x/x just/x/x wait/x ./x ./x ./x/x ”/x/x 意思/x 是/x :/x 从/x 那个/x 市场/x 退出/x ?/x 你/x 还/x 会/x 看到/x 另外/x 一个/x 结果/x 。/x 毫无疑问/x ,/x 那个/x 市场/x 指/x 的/x 就是/x 中国/x 大陆/x 。/x 而/x 另外/x 的/x 结果/x ,/x 对应/x 此/x 媒体/x 报道/x ,/x 就是/x 收购/x 百/x 度/x ,/x 从而/x 曲线/x 返回/x 大陆/x 搜索/x 市场/x 。/x
/x /x 在/x 最近/x 刚刚/x 结束/x 的/x 深圳/x IT/x 领袖/x 峰/x 会上/x ,/x 李/x 彦/x 宏/x 曾/x 言/x ,/x “/x 谷/x 歌/x 没有/x 退出/x 中国/x ,/x 因为/x 还/x 在/x 香港/x ”/x 。/x 也/x 似乎/x 在/x 验证/x 被/x 收购/x 的/x 这/x 一/x 事实/x 。/x
/x /x 截止/x 发稿/x ,/x 百/x 度/x 的/x 股价/x 为/x 597/x 美元/x ,/x 市值/x 为/x 207/x 亿/x 美元/x 。/x 谷/x 歌/x 以/x 高达/x 300/x 亿/x 美元/x 的/x 价格/x ,/x 实际/x 溢价/x 高达/x 50/x %/x 。/x 而/x 谷/x 歌/x 市值/x 高达/x 1796/x 亿/x 美元/x ,/x 而且/x 手/x 握/x 大量/x 现金/x ,/x 作/x 这样/x 的/x 决策/x 也/x 在/x 情理之中/x 。/x
/x/x/x/x 近日/x ,/x 很多/x 媒体/x 都/x 在/x 报道/x 百/x 度/x 创始人/x 、/x CEO/x 李/x 彦/x 宏/x 的/x 两/x 次/x 拒/x 购/x :/x 一/x 次/x 是/x 百/x 度/x 上市/x 前夕/x ,/x 李/x 彦/x 宏/x 拒绝/x 谷/x 歌/x 的/x 并购/x ,/x 这个/x 细节/x 在/x 2/x 月/x 28/x 日/x 央视/x 虎年/x 首/x 期/x 对话/x 节目/x 中/x 得到/x 首次/x 披露/x ﹔/x 一/x 次/x 是/x 在/x 百/x 度/x 国际化/x 战略/x 中/x ,/x 拒绝/x 采用/x 海外/x 并购/x 的/x 方式/x ,/x 而是/x 采取/x 了/x 从/x 日本/x 市场/x 开始/x 的/x 海外/x 自主/x 发展/x 之/x 路/x 。/x 这/x 也/x 让/x 笔者/x 由此/x 开始/x 思考/x 民族/x 品牌/x 的/x 发展/x 之/x 路/x 。/x/x
/x /x 收购/x 是/x 打/x 压/x 中国/x 品牌/x 的/x 惯用/x 伎俩/x
/x /x 2010/x 年/x 2/x 月/x 28/x 日/x ,/x 央视/x 经济/x 频道/x 《/x 对话/x 》/x 节目/x 昨晚/x 推出/x 虎年/x 首/x 期/x 节目/x ,/x 百/x 度/x 董事长/x 兼/x CEO/x 李/x 彦/x 宏/x 作为/x 嘉宾/x 做客/x 节目/x 。/x 李/x 彦/x 宏/x 首度/x 谈及/x 2005/x 年/x 百/x 度/x 上市/x 前夕/x ,/x 谷/x 歌/x CEO/x 施/x 密/x 特/x 曾/x 秘密/x 造访/x 百/x 度/x 时/x 秘密/x 谈话/x 的/x 内容/x ,/x 主要/x 是/x 劝阻/x 百/x 度/x 上市/x ,/x 李/x 彦/x 宏/x 断然/x 拒绝/x 了/x 施/x 密/x 特/x 的/x “/x 好意/x ”/x 。/x 今天/x 看来/x ,/x 施/x 密/x 特/x 当日/x 也许/x 已/x 有/x 不祥/x 的/x 预感/x ,/x 这个/x 几/x 百/x 人/x 的/x 小/x 公司/x 终/x 有/x 一日/x 会/x 成为/x 他们/x 的/x 大/x 麻烦/x 。/x
/x /x 本期/x 《/x 对话/x 》/x 一经/x 播出/x ,/x 便/x 引发/x 了/x 业界/x 讨论/x 。/x
/x /x 外资/x 品牌/x 通过/x 收购/x 打/x 压/x 中国/x 品牌/x 的/x 案例/x 不胜枚举/x 。/x 从/x 以往/x 跨国/x 企业/x 并购/x 的/x 中国/x 品牌/x 来看/x ,/x 真正/x 让/x 其/x 活/x 下来/x 的/x 品牌/x 并不/x 多/x ,/x 要么/x 被/x 雪/x 藏/x ,/x 要么/x 被/x 低/x 端/x 化/x 。/x
/x /x 因此/x ,/x 2005/x 年/x 百/x 度/x 没有/x 接受/x Google/x 的/x 收购/x 邀请/x ,/x 坚持/x 自主/x 发展/x ,/x 这/x 对于/x 保护/x 中国/x 品牌/x ,/x 维护/x 中国/x 网/x 民/x 信息/x 安全/x 有着/x 至关重要/x 的/x 作用/x 。/x 当前/x 百/x 度/x 市场/x 份额/x 高达/x 76/x %/x ,/x 并/x 持续/x 增长/x ,/x 这/x 也/x 充分/x 验证/x 了/x 李/x 彦/x 宏/x 拒绝/x 收购/x 决策/x 的/x 正确性/x 。/x
/x /x 今天/x 看来/x ,/x “/x 百/x 度/x 一下/x ”/x 已经/x 成为/x 3/x 亿/x 多/x 中国/x 网/x 民/x 的/x 网络/x 生存/x 法则/x ,/x 而/x 直到/x 今天/x 环视/x 全球/x ,/x 真正/x 能/x 像/x 中国/x 一样/x ,/x 拥有/x 自己/x 独立/x 搜索引擎/x 的/x 只有/x 4/x 个/x 国家/x !/x 我们/x 也许/x 应该/x 庆幸/x 当时/x 李/x 彦/x 宏/x 的/x 选择/x 。/x 这个/x 故事/x 也/x 告诉/x 我们/x ,/x 中国/x 企业/x 做/x 品牌/x 还要/x 靠/x 自己/x !/x
/x /x 收购/x 也/x 可能/x 是/x 中国/x 企业/x 走/x 出去/x 的/x 陷阱/x
/x /x 同样/x 在/x 2/x 月/x 28/x 日/x ,/x 亚布力/x 第/x 十/x 届/x 年/x 会上/x ,/x 李/x 彦/x 宏/x 在/x 论坛/x 上/x 指出/x :/x “/x 我们/x 和/x 很多/x 其它/x 公司/x 的/x 国际化/x 路子/x 是/x 很/x 不/x 一样/x 的/x ,/x 我们/x 不/x 是/x 去/x 买/x 一个/x 国外/x 的/x 公司/x ,/x ”/x ,/x 李/x 彦/x 宏/x 解释/x 了/x 百/x 度/x 率先/x 选择/x 日本/x 作为/x 走/x 出去/x 的/x 对象/x 的/x 原因/x ,/x 因为/x 日本/x 和/x 中国/x 一衣带水/x 的/x 近邻/x 优势/x ,/x 日本/x 的/x 市场/x 规模/x ,/x 在/x 日本/x 也/x 没有/x 一家/x 独/x 大/x 的/x 搜索引擎/x 。/x
/x /x 中国/x 企业/x 收购/x 这些/x 外资/x 品牌/x 目的/x 是/x “/x 借/x 船/x 出海/x ”/x 。/x 外资/x 品牌/x 进入/x 中/x 国是/x 收购/x 中国/x 优质/x 品牌/x ,/x 而/x 中国/x 企业/x 进入/x 国外/x 市场/x 的/x 收购/x 策略/x 恰恰相反/x ,/x 这/x 也/x 是/x 中国/x 企业/x 借/x 船/x 出海/x 屡屡/x 失败/x 的/x 原因/x 所在/x 。/x
/x /x 笔者/x 认为/x ,/x 中国/x 互联网/x 公司/x 走/x 出去/x 要/x 依靠/x 自身/x 发展/x ,/x 并不/x 能/x 单纯/x 依靠/x 收购/x 。/x 李/x 彦/x 宏/x 在/x 百/x 度/x 成立/x 伊始/x 就/x 抱定/x 了/x 国际化/x 决心/x ,/x 使/x 百/x 度/x 真正/x 在/x 面对/x 国际化/x 机遇/x 时/x ,/x 更加/x 冷静/x 和/x 具有/x 前瞻/x 力/x 。/x 李/x 彦/x 宏/x 也/x 承认/x 当前/x 百/x 度/x 在/x 日本/x 还/x 处于/x 初级/x 发展/x 阶段/x ,/x 但/x 他/x 也/x 预言/x “/x 2012/x 年/x ,/x 百/x 度/x 与/x Google/x 划/x 洋/x 而/x 治/x ”/x ,/x 对此/x 我们/x 拭目以待/x !/x
/x /x </x //x content/x >/x
/x /x </x author/x _/x id/x >/x 1/x </x //x author/x _/x id/x >/x
/x </x //x sphinx/x :/x document/x >/x
/x </x sphinx/x :/x document/x/x id/x =/x "/x 2/x "/x >/x
/x /x </x subject/x >/x Twitter/x 主页/x 改版/x/x 推/x 普通/x 用户/x 消息/x 增加/x 趋势/x 话题/x </x //x subject/x >/x
/x /x </x published/x >/x 1270135548/x </x //x published/x >/x
/x /x </x content/x >/x 4/x 月/x 1/x 日/x 消息/x ,/x 据/x 国外/x 媒体/x 报道/x ,/x Twitter/x 本/x 周二/x 推出/x 新版/x 主页/x ,/x 目的/x 很/x 简单/x :/x 帮助/x 新/x 用户/x 了解/x Twitter/x 和/x 增加/x 用户/x 黏稠度/x 。/x
/x /x 新版/x Twittter/x 入口处/x 的/x 内容/x 眼花缭乱/x ,/x 在/x 头部/x 下方/x 有/x 滚动/x 的/x 热门/x 趋势/x 话题/x ,/x 左边/x 列出/x 了/x 普通/x 用户/x 账户/x 和/x 他们/x 最新/x 的/x 消息/x 。/x
/x /x 另/x 一个/x 显著/x 的/x 部分/x 是/x “/x Top/x/x Tweets/x ”/x ,/x 它/x 采用/x 了/x 新/x 算法/x 推选/x 出/x 最/x 热门/x 的/x 话题/x ,/x 每个/x 几/x 秒/x 刷新/x 一/x 次/x 。/x Twitter/x 首席/x 科学家/x Abdur/x/x Chowdhury/x 表示/x ,/x 这种/x 算法/x 选出/x 了/x 所有/x 用户/x 的/x 信息/x ,/x 而/x 不/x 是/x 拥有/x 大量/x 追随者/x 所/x 发/x 的/x 信息/x 。/x
/x /x 首/x 页/x 对于/x 首次/x 访问/x 网站/x 的/x 用户/x 非常/x 重要/x ,/x 因为/x 这/x 决定/x 了/x 用户/x 的/x 第一/x 印象/x 。/x 研究/x 发现/x ,/x 多/x 达/x 60/x %/x 的/x Twittter/x 用户/x 在/x 注册/x 后/x 的/x 一个/x 月/x 内/x 不再/x 访问/x 网站/x 。/x Twittter/x 希望/x 能/x 更/x 好/x 地/x 展现/x 网站/x 的/x 面貌/x ,/x 帮助/x 游客/x 找到/x 感/x 兴趣/x 的/x 东西/x 。/x
/x /x </x //x content/x >/x
/x /x </x author/x _/x id/x >/x 1/x </x //x author/x _/x id/x >/x
/x </x //x sphinx/x :/x document/x >/x
/x </x sphinx/x :/x document/x/x id/x =/x "/x 3/x "/x >/x
/x /x </x subject/x >/x 死/x 都/x 要/x 上/x !/x Opera/x/x Mini/x/x 体验/x 版/x 抢先/x 试用/x </x //x subject/x >/x
/x /x </x published/x >/x 1270094460/x </x //x published/x >/x
/x /x </x content/x >/x Opera/x 一直/x 都/x 被/x 认为/x 是/x 浏览/x 速度/x 飞快/x ,/x 同时/x 在/x 移动/x 平台/x 上/x 更/x 是/x 占有/x 不少/x 的/x 份额/x 。/x 不久前/x ,/x Opera/x 正式/x 向/x 苹果/x 提交/x 了/x 针对/x iPhone/x 设计/x 的/x Opera/x/x Mini/x 。/x 日前/x ,/x 台湾/x IT/x 网站/x 放出/x 了/x Opera/x/x Mini/x 和/x Safari/x 的/x 评测/x 文章/x ,/x 下面/x 让/x 我们/x 看看/x Opera/x 和/x Safari/x 到底/x 谁/x 更/x 好/x 用/x 更/x 快/x 吧/x 。/x
/x /x Opera/x/x Mini/x/x VS/x/x Safari/x ,/x 显示/x 方式/x 很/x 不/x 相同/x
和/x Safari/x 不同/x 的/x 是/x ,/x Opera/x/x Mini/x 会/x 针对/x 手机/x 对/x 网页/x 进行/x 一些/x 调整/x
/x /x Opera/x/x Mini/x 与/x Safari/x 的/x 运作/x 原理/x 不大/x 相同/x 。/x 网页/x 会/x 通过/x Opera/x 的/x 服务器/x 完整/x 压缩/x 后/x 再/x 发送/x 到手/x 机上/x ,/x 不/x 像/x Safari/x 可/x 通过/x Multi/x -/x Touch/x 和/x 点/x 击/x 的/x 方式/x 自由/x 缩/x 放/x ,/x Opera/x/x Mini/x 会/x 预先/x 将/x 文字/x 照/x iPhone/x 的/x 宽度/x 做好/x 调整/x ,/x 点/x 击/x 区域/x 后/x 自动/x 放大/x 。/x 如果/x 习惯/x 了/x Safari/x 的/x 浏览/x 方式/x ,/x 会/x 感觉/x 不大/x 顺手/x ,/x 不过/x 对/x 许多/x 宽度/x 太/x 宽/x ,/x 缩/x 放/x 后/x 文字/x 仍然/x 显示/x 很/x 小/x 的/x 网页/x 来说/x ,/x Opera/x/x Mini/x 的/x 显示/x 方式/x 比较/x 有/x 优势/x 。/x
/x /x 打开/x 测试/x 网站/x 首/x 页/x 所/x 花费/x 的/x 流量/x ,/x Safari/x 和/x Opera/x/x Mini/x 的/x 差距/x 明显/x 可见/x 。/x 这个/x 在/x 国内/x 移动/x 资费/x 超高/x 的/x 局面/x 来说/x ,/x Opera/x/x Mini/x 估计/x 会/x 比较/x 受/x 欢迎/x 和/x 省钱/x 。/x
Opera/x/x Mini/x 的/x 流量/x 少/x 得/x 惊人/x ,/x 仅/x 是/x Safari/x 的/x 十分/x 之一/x
/x /x 兼容性/x 相比/x ,/x Safari/x 完/x 胜/x
打开/x Google/x 首/x 页/x ,/x Safari/x 上/x 是/x iPhone/x 专用/x 界面/x ,/x Opera/x 则/x 是/x 一般/x 移动/x 版本/x
/x /x Opera/x/x Mini/x 的/x 速度/x 和/x 省/x 流量/x 还是/x 无法/x 取代/x Safari/x 成为/x iPhone/x 上/x 的/x 主要/x 浏览器/x 。/x 毕竟/x iPhone/x 的/x 高/x 占有率/x 让/x 许多/x 网站/x ,/x 线/x 上/x 服务/x 都/x 为/x Safari/x 设计/x 了/x 专用/x 页面/x 。/x 光/x Google/x 的/x 首/x 页/x 为/x 例子/x 就/x 看出/x 了/x 明显/x 的/x 差别/x 。/x 另外/x ,/x 像/x Google/x/x Buzz/x 这样/x 线/x 上/x 应用/x ,/x 就/x 会/x 出现/x 显示/x 错误/x 。/x
Google/x/x Buzz/x 上/x ,/x Opera/x 无法/x 输入/x 内容/x
/x /x Opera/x/x Mini/x 其他/x 专属/x 功能/x
页面/x 内/x 搜索/x 和/x 关键字/x 直接/x 搜索/x 相当/x 人性化/x
/x /x 除了/x Opera/x 独创/x 的/x Speed/x/x Dial/x 九宫/x 格/x 快速/x 启动/x 页面/x 外/x ,/x 和/x Opera/x/x Link/x 和/x 电脑/x 上/x 的/x Opera/x 直接/x 同步/x 书签/x 、/x Speed/x/x Dial/x 设定/x 外/x 。/x Opera/x/x Mini/x 还/x 能够/x 直接/x 搜索/x 页面/x 中/x 的/x 文字/x ,/x 查找/x 资料/x 时/x 相当/x 方便/x 。/x 另外/x 也/x 能/x 选取/x 文字/x 另/x 开/x 新/x 分/x 页/x 搜索/x ,/x 比起/x Safari/x 还要/x 复制/x 、/x 开/x 新/x 页/x 、/x 粘贴/x 简单/x 许多/x 。/x 同时/x 还/x 能/x 将/x 整个/x 页面/x 打包/x 存储/x ,/x 方便/x 离/x 线/x 浏览/x 。/x
/x /x 现在/x Opera/x/x Mini/x 想/x 要/x 打败/x Safari/x 还/x 剩下/x 一个/x 很/x 严重/x 的/x 问题/x -/x 苹果/x 何时/x 会/x 或者/x 会/x 不/x 会/x 通过/x Opera/x/x Mini/x 的/x 审核/x 。/x
/x /x </x //x content/x >/x
/x /x </x author/x _/x id/x >/x 2/x </x //x author/x _/x id/x >/x
/x </x //x sphinx/x :/x document/x >/x
</x //x sphinx/x :/x docset/x >/x
Word Splite took: 4 ms.
root:/var/coreseek-4.1-beta/csft-4.1# 07、修改配置文件vi /var/coreseek-4.1-beta/testpack/etc/csft.conf 修改后的配置文件内容:#XML数据源配置,详情请查看:http://www.coreseek.cn/products-install/datasource/
#源定义
source xml
{
type = xmlpipe2
xmlpipe_command = cat /usr/local/coreseek/var/test/test.xml
#请修改为实际使用的绝对路径,例如:cat /usr/local/coreseek/var/...
}
#index定义
index xml
{
source = xml #对应的source名称
path = /usr/local/coreseek/var/data/xml #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
docinfo = extern
mlock = 0
morphology = none
min_word_len = 1
html_strip = 0
#中文分词配置,详情请查看:http://www.coreseek.cn/products-install/coreseek_mmseg/
charset_dictpath = /usr/local/mmseg3/etc/ #BSD、Linux环境下设置,/符号结尾
#charset_dictpath = etc/ #Windows环境下设置,/符号结尾,最好给出绝对路径,例如:C:/usr/local/coreseek/etc/...
charset_type = zh_cn.utf-8
}
#全局index定义
indexer
{
mem_limit = 128M #内存使用限制
}
#searchd服务定义
searchd
{
listen = 9312
read_timeout = 5
max_children = 30
max_matches = 1000
seamless_rotate = 0
preopen_indexes = 0
unlink_old = 1
pid_file = /usr/local/coreseek/var/log/searchd_xml.pid #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
log = /usr/local/coreseek/var/log/searchd_xml.log #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
query_log = /usr/local/coreseek/var/log/query_xml.log #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
binlog_path = #关闭 binlog 日志
}
vi /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf修改后的配置文件内容:#MySQL数据源配置,详情请查看:http://www.coreseek.cn/products-install/mysql/
#请先将var/test/documents.sql导入数据库,并配置好以下的MySQL用户密码数据库
#源定义
source mysql
{
type = mysql
sql_host = localhost
sql_user = root #MySQL 管理员 root 用户
sql_pass = xxxxxxxxxxxx #root 用户密码
sql_db = documents #MySQL 数据库名称
sql_port = 3306 #MySQL 数据库端口
sql_query_pre = SET NAMES utf8
sql_query = SELECT id, group_id, UNIX_TIMESTAMP(date_added) AS date_added, title, content FROM documents
#sql_query第一列id需为整数
#title、content作为字符串/文本字段,被全文索引
sql_attr_uint = group_id #从SQL读取到的值必须为整数
sql_attr_timestamp = date_added #从SQL读取到的值必须为整数,作为时间属性
sql_query_info_pre = SET NAMES utf8 #命令行查询时,设置正确的字符集
sql_query_info = SELECT * FROM documents WHERE id=$id #命令行查询时,从数据库读取原始数据信息
}
#index定义
index mysql
{
source = mysql #对应的source名称
path = /usr/local/coreseek/var/data/mysql #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
docinfo = extern
mlock = 0
morphology = none
min_word_len = 1
html_strip = 0
#中文分词配置,详情请查看:http://www.coreseek.cn/products-install/coreseek_mmseg/
charset_dictpath = /usr/local/mmseg3/etc/ #BSD、Linux环境下设置,/符号结尾
#charset_dictpath = etc/ #Windows环境下设置,/符号结尾,最好给出绝对路径,例如:C:/usr/local/coreseek/etc/...
charset_type = zh_cn.utf-8
}
#全局index定义
indexer
{
mem_limit = 128M #内存使用限制
}
#searchd服务定义
searchd
{
listen = 9312
read_timeout = 5
max_children = 30
max_matches = 1000
seamless_rotate = 0
preopen_indexes = 0
unlink_old = 1
pid_file = /usr/local/coreseek/var/log/searchd_mysql.pid #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
log = /usr/local/coreseek/var/log/searchd_mysql.log #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
query_log = /usr/local/coreseek/var/log/query_mysql.log #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
binlog_path = #关闭 binlog 日志
}08、 创建数据库 documents,导入备份数据root:/var/coreseek-4.1-beta/csft-4.1# mysql -u root -p
Enter password: #键入 MariaDB 或 MySQL 的 root 用户密码
Welcome to the MariaDB monitor.Commands end with ; or \g.
Your MariaDB connection id is 457
Server version: 5.5.40-MariaDB-0ubuntu0.14.04.1 (Ubuntu)
Copyright (c) 2000, 2014, Oracle, Monty Program Ab and others.
Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.
MariaDB [(none)]> create database documents; #创建数据库
Query OK, 1 row affected (0.00 sec)
MariaDB [(none)]> use documents; #切换数据库
Database changed
MariaDB > source/var/coreseek-4.1-beta/testpack/var/test/documents.sql; #导入数据库备份数据
Query OK, 0 rows affected (0.00 sec)
Query OK, 0 rows affected (0.00 sec)
Query OK, 0 rows affected (0.00 sec)
Query OK, 0 rows affected (0.00 sec)
Query OK, 0 rows affected (0.00 sec)
Query OK, 0 rows affected, 1 warning (0.00 sec)
Query OK, 0 rows affected (0.03 sec)
Query OK, 3 rows affected (0.00 sec)
Records: 3Duplicates: 0Warnings: 0
MariaDB > exit #退出数据库
Bye
root:/var/coreseek-4.1-beta/csft-4.1#09、 查看索引配置是否可以正确运行root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf
Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
Copyright (c) 2007-2011,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)
ERROR: nothing to do.
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /var/coreseek-4.1-beta/testpack/etc/csft.conf
Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
Copyright (c) 2007-2011,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)
ERROR: nothing to do.
root:/var/coreseek-4.1-beta/csft-4.1#
10、 查看正常索引全部数据时的提示信息
root:/var/coreseek-4.1-beta/csft-4.1# mkdir /usr/local/coreseek/var/test
root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/var/test/test.xml /usr/local/coreseek/var/test/test.xml
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf --all
Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
Copyright (c) 2007-2011,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)
using config file '/var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf'...
indexing index 'mysql'...
collected 3 docs, 0.0 MB
sorted 0.0 Mhits, 100.0% done
total 3 docs, 7545 bytes
total 0.012 sec, 607048 bytes/sec, 241.37 docs/sec
total 3 reads, 0.000 sec, 2.8 kb/call avg, 0.2 msec/call avg
total 9 writes, 0.000 sec, 2.2 kb/call avg, 0.0 msec/call avg
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /var/coreseek-4.1-beta/testpack/etc/csft.conf --all
Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
Copyright (c) 2007-2011,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)
using config file '/var/coreseek-4.1-beta/testpack/etc/csft.conf'...
indexing index 'xml'...
collected 3 docs, 0.0 MB
sorted 0.0 Mhits, 100.0% done
total 3 docs, 7585 bytes
total 0.008 sec, 932390 bytes/sec, 368.77 docs/sec
total 3 reads, 0.000 sec, 2.8 kb/call avg, 0.0 msec/call avg
total 9 writes, 0.000 sec, 2.2 kb/call avg, 0.0 msec/call avg
root:/var/coreseek-4.1-beta/csft-4.1#
11、查看无关键词,正常搜索时的提示信息
root@npt-Aspire-4920:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/search -c /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf
Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
Copyright (c) 2007-2011,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)
using config file '/var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf'...
index 'mysql': query '': returned 3 matches of 3 total in 0.000 sec
displaying matches:
1. document=1, weight=1, group_id=2, date_added=Thu Apr1 22:20:07 2010
id=1
title=愚人节最佳蛊惑爆料 谷歌300亿美元收购百度
content=据国外媒体报道,谷歌将巨资收购百度,涉及金额高达300亿美元。谷歌借此重返大陆市场。 该报道称,目前谷歌与百度已经达成了收购协议,将择机对外公布。百度的管理层将100%保留,但会将项目缩减,包括有啊商城,以及目前实施不力的凤巢计划。正在进行测试阶段的视频网站qiyi.com将输入更多的Youtube资源。(YouTube在大陆区因内容审查暂不能访问)。 该消息似乎得到了谷歌CEO施密特的确认,在其twitter上用简短而暧昧的文字进行了表述:“ Withdraw from that market? u'll also see another result, just wait... ” 意思是:从那个市场退出?你还会看到另外一个结果。毫无疑问,那个市场指的就是中国大陆。而另外的结果,对应此媒体报道,就是收购百度,从而曲线返回大陆搜索市场。 在最近刚刚结束的深圳IT领袖峰会上,李彦宏曾言,“谷歌没有退出中国,因为还在香港”。也似乎在验证被收购的这一事实。 截止发稿,百度的股价为597美元,市值为207亿美元。谷歌以高达300亿美元的价格,实际溢价高达50%。而谷歌市值高达1796亿美元,而且手握大量现金,作这样的决策也在情理之中。 近日,很多媒体都在报道百度创始人、CEO李彦宏的两次拒购:一次是百度上市前夕,李彦宏拒绝谷歌的并购,这个细节在2月28日央视虎年首期对话节目中得到首次披露﹔一次是在百度国际化战略中,拒绝采用海外并购的方式,而是采取了从日本市场开始的海外自主发展之路。这也让笔者由此开始思考民族品牌的发展之路。 收购是打压中国品牌的惯用伎俩 2010年2月28日,央视经济频道《对话》节目昨晚推出虎年首期节目,百度董事长兼CEO李彦宏作为嘉宾做客节目。李彦宏首度谈及2005年百度上市前夕,谷歌CEO施密特曾秘密造访百度时秘密谈话的内容,主要是劝阻百度上市,李彦宏断然拒绝了施密特的“好意”。今天看来,施密特当日也许已有不祥的预感,这个几百人的小公司终有一日会成为他们的大麻烦。 本期《对话》一经播出,便引发了业界讨论。 外资品牌通过收购打压中国品牌的案例不胜枚举。从以往跨国企业并购的中国品牌来看,真正让其活下来的品牌并不多,要么被雪藏,要么被低端化。 因此,2005年百度没有接受Google的收购邀请,坚持自主发展,这对于保护中国品牌,维护中国网民信息安全有着至关重要的作用。当前百度市场份额高达76%,并持续增长,这也充分验证了李彦宏拒绝收购决策的正确性。 今天看来,“百度一下”已经成为3亿多中国网民的网络生存法则,而直到今天环视全球,真正能像中国一样,拥有自己独立搜索引擎的只有4个国家!我们也许应该庆幸当时李彦宏的选择。这个故事也告诉我们,中国企业做品牌还要靠自己! 收购也可能是中国企业走出去的陷阱 同样在2月28日,亚布力第十届年会上,李彦宏在论坛上指出:“我们和很多其它公司的国际化路子是很不一样的,我们不是去买一个国外的公司,”,李彦宏解释了百度率先选择日本作为走出去的对象的原因,因为日本和中国一衣带水的近邻优势,日本的市场规模,在日本也没有一家独大的搜索引擎。 中国企业收购这些外资品牌目的是“借船出海”。外资品牌进入中国是收购中国优质品牌,而中国企业进入国外市场的收购策略恰恰相反,这也是中国企业借船出海屡屡失败的原因所在。 笔者认为,中国互联网公司走出去要依靠自身发展,并不能单纯依靠收购。李彦宏在百度成立伊始就抱定了国际化决心,使百度真正在面对国际化机遇时,更加冷静和具有前瞻力。李彦宏也承认当前百度在日本还处于初级发展阶段,但他也预言“2012年,百度与Google划洋而治”,对此我们拭目以待!
date_added=2010-04-01 22:20:07
author_id=1
group_id=2
2. document=2, weight=1, group_id=3, date_added=Thu Apr1 23:25:48 2010
id=2
title=Twitter主页改版 推普通用户消息增加趋势话题
content=4月1日消息,据国外媒体报道,Twitter本周二推出新版主页,目的很简单:帮助新用户了解Twitter和增加用户黏稠度。 新版Twittter入口处的内容眼花缭乱,在头部下方有滚动的热门趋势话题,左边列出了普通用户账户和他们最新的消息。 另一个显著的部分是“Top Tweets”,它采用了新算法推选出最热门的话题,每个几秒刷新一次。Twitter首席科学家Abdur Chowdhury表示,这种算法选出了所有用户的信息,而不是拥有大量追随者所发的信息。 首页对于首次访问网站的用户非常重要,因为这决定了用户的第一印象。研究发现,多达60%的Twittter用户在注册后的一个月内不再访问网站。Twittter希望能更好地展现网站的面貌,帮助游客找到感兴趣的东西。
date_added=2010-04-01 23:25:48
author_id=1
group_id=3
3. document=3, weight=1, group_id=3, date_added=Thu Apr1 12:01:00 2010
id=3
title=死都要上!Opera Mini 体验版抢先试用
content=Opera一直都被认为是浏览速度飞快,同时在移动平台上更是占有不少的份额。不久前,Opera正式向苹果提交了针对iPhone设计的Opera Mini。日前,台湾IT网站放出了Opera Mini和Safari的评测文章,下面让我们看看Opera和Safari到底谁更好用更快吧。 Opera Mini VS Safari,显示方式很不相同和Safari不同的是,Opera Mini会针对手机对网页进行一些调整 Opera Mini与Safari的运作原理不大相同。网页会通过Opera的服务器完整压缩后再发送到手机上,不像Safari可通过Multi-Touch和点击的方式自由缩放,Opera Mini会预先将文字照iPhone的宽度做好调整,点击区域后自动放大。如果习惯了Safari的浏览方式,会感觉不大顺手,不过对许多宽度太宽,缩放后文字仍然显示很小的网页来说,Opera Mini的显示方式比较有优势。 打开测试网站首页所花费的流量,Safari和Opera Mini的差距明显可见。这个在国内移动资费超高的局面来说,Opera Mini估计会比较受欢迎和省钱。Opera Mini的流量少得惊人,仅是Safari的十分之一 兼容性相比,Safari完胜打开Google首页,Safari上是iPhone专用界面,Opera则是一般移动版本 Opera Mini的速度和省流量还是无法取代Safari成为iPhone上的主要浏览器。毕竟iPhone的高占有率让许多网站,线上服务都为Safari设计了专用页面。光Google的首页为例子就看出了明显的差别。另外,像Google Buzz这样线上应用,就会出现显示错误。Google Buzz上,Opera无法输入内容 Opera Mini其他专属功能页面内搜索和关键字直接搜索相当人性化 除了Opera独创的Speed Dial九宫格快速启动页面外,和Opera Link和电脑上的Opera直接同步书签、Speed Dial设定外。Opera Mini还能够直接搜索页面中的文字,查找资料时相当方便。另外也能选取文字另开新分页搜索,比起Safari还要复制、开新页、粘贴简单许多。同时还能将整个页面打包存储,方便离线浏览。 现在Opera Mini想要打败Safari还剩下一个很严重的问题-苹果何时会或者会不会通过Opera Mini的审核。
date_added=2010-04-01 12:01:00
author_id=2
group_id=3
words:
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/search -c /var/coreseek-4.1-beta/testpack/etc/csft.conf
Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
Copyright (c) 2007-2011,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)
using config file '/var/coreseek-4.1-beta/testpack/etc/csft.conf'...
index 'xml': query '': returned 3 matches of 3 total in 0.000 sec
displaying matches:
1. document=1, weight=1, published=Thu Apr1 22:20:07 2010, author_id=1
2. document=2, weight=1, published=Thu Apr1 23:25:48 2010, author_id=1
3. document=3, weight=1, published=Thu Apr1 12:01:00 2010, author_id=2
words:
root:/var/coreseek-4.1-beta/csft-4.1#12、查看有关键词,正常搜索时的提示信息
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/search -c /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf 关键词搜索测试
Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
Copyright (c) 2007-2011,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)
using config file '/var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf'...
index 'mysql': query '关键词搜索测试 ': returned 0 matches of 0 total in 0.000 sec
words:
1. '关键词': 0 documents, 0 hits
2. '搜索': 2 documents, 5 hits
3. '测试': 2 documents, 2 hits
root@npt-Aspire-4920:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/search -c /var/coreseek-4.1-beta/testpack/etc/csft.conf 关键词搜索测试
Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
Copyright (c) 2007-2011,
Beijing Choice Software Technologies Inc (http://www.coreseek.com)
using config file '/var/coreseek-4.1-beta/testpack/etc/csft.conf'...
index 'xml': query '关键词搜索测试 ': returned 0 matches of 0 total in 0.000 sec
words:
1. '关键词': 0 documents, 0 hits
2. '搜索': 2 documents, 5 hits
3. '测试': 2 documents, 2 hits
root:/var/coreseek-4.1-beta/csft-4.1#13、准备 PHP 动态网站 Coreseek 相关测试文件
root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf/usr/local/coreseek/etc/csft_mysql.conf #拷贝 MySQL 配置文件
root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/etc/csft.conf/usr/local/coreseek/etc/csft.conf #拷贝 XML 配置文件
root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/api/sphinxapi.php/usr/share/nginx/html/sphinxapi.php
root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/api/test.php /usr/share/nginx/html/test.php #也可采用以下自定义 test.php 文件
root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/api/test_coreseek.php/usr/share/nginx/html/test_coreseek.php
root:/var/coreseek-4.1-beta/csft-4.1# 自定义新建/usr/share/nginx/html/test.php 文件;
vi/usr/share/nginx/html/test.php /usr/share/nginx/html/test.php 自定义文件内容如下:
<?php
//注意文件的编码格式需要保存为为UTF-8格式
require ( "sphinxapi.php" );
$cl = new SphinxClient ();
$cl->SetServer ( '127.0.0.1', 9312);
//以下设置用于返回数组形式的结果
$cl->SetArrayResult ( true );
/*
//ID的过滤
$cl->SetIDRange(3,4);
//sql_attr_uint等类型的属性字段,需要使用setFilter过滤,类似SQL的WHERE group_id=2
$cl->setFilter('group_id',array(2));
//sql_attr_uint等类型的属性字段,也可以设置过滤范围,类似SQL的WHERE group_id2>=6 AND group_id2<=8
$cl->SetFilterRange('group_id2',6,8);
*/
//取从头开始的前20条数据,0,20类似SQl语句的LIMIT 0,20
$cl->SetLimits(0,20);
//在做索引时,没有进行 sql_attr_类型 设置的字段,可以作为“搜索字符串”,进行全文搜索
$res = $cl->Query ( '搜索字符串', "*" ); //"*"表示在所有索引里面同时搜索,"索引名称(例如test或者test,test2)"则表示搜索指定的
//如果需要搜索指定全文字段的内容,可以使用扩展匹配模式:
//$cl->SetMatchMode(SPH_MATCH_EXTENDED);
//$res=cl->Query( '@title (测试)' , "*");
//$res=cl->Query( '@title (测试) @content ('网络')' , "*");
echo '<pre>';
print_r($res['matches']);
print_r($res);
print_r($cl->GetLastError());
print_r($cl->GetLastWarning());
echo '</pre>';
?>14、管理 Coreseek 服务及进程root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --all#建立 MySQL 索引服务
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --all#建立 XML 索引服务
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --all --rotate#更新 MySQL 索引服务
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --all --rotate#更新 XML 索引服务
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf --console#启动 MySQL 测试模式
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf --console#启动 XML 测试模式
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --rotate#重建 MySQL 所有索引
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --rotate#重建 XML 所有索引
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf#开启 MySQL 搜索服务
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf#开启 XML 搜索服务
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf --stop#停止 MySQL 搜索服务
root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf --stop#停止 XML 搜索服务
查看进程:ps aux|grep searchd杀死进程:killall searchd
15、测试 PHP 文件
在 FireFox 或 IE 浏览器中键入 http://localhost/test.php 或 http://127.0.0.1/test.php (或http://服务器 IP 地址/test.php 或http://网站域名/test.php),返回内容如下:自定义 /usr/share/nginx/html/test.php 返回内容如下:
在 FireFox 或 IE 浏览器中键入 http://localhost/test_coreseek.php 或 http://127.0.0.1/test_coreseek.php (或http://服务器 IP 地址/test_coreseek.php 或http://网站域名/test_coreseek.php),返回内容如下:16、设置开机后 Coreseek 后台自动运行,及定时任务
设置开机自动开启 MySQL 搜索服务
vi /etc/init.d/rc.local#!/bin/sh -e
#
# rc.local
#
# This script is executed at the end of each multiuser runlevel.
# Make sure that the script will "exit 0" on success or any other
# value on error.
#
# In order to enable or disable this script just change the execution
# bits.
#
# By default this script does nothing.
exit 0
/usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf #添加这行开机自动开启 MySQL 搜索服务设置定时任务
1、新建 /usr/local/coreseek/bin/build_index.sh 文件;
vi /usr/local/coreseek/bin/build_index.sh /usr/local/coreseek/bin/build_index.sh 文件内容如下:
#!/bin/sh
/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --all --rotate #增量更新索引
2、修改定时任务设置文件
vi /etc/crontab/etc/crontab 文件修改后内容如下:
# /etc/crontab: system-wide crontab
# Unlike any other crontab you don't have to run the `crontab'
# command to install the new version when you edit this file
# and files in /etc/cron.d. These files also have username fields,
# that none of the other crontabs do.
SHELL=/bin/sh
PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin
# m h dom mon dow user command
17 * * * * root cd / && run-parts --report /etc/cron.hourly
25 6 * * * root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.daily )
47 6 * * 7 root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.weekly )
52 6 1 * * root test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.monthly )
*/30 * * * * root /usr/local/coreseek/bin/build_index.sh #每 30 分钟增量更新索引一次
30 3 * * * root /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --rotate #每天 3 点 30 分重建索引一次
#service cron restart|reload #重启或重载 crontab 服务
版权声明:
本文为独家原创稿件,版权归 德云社区,未经许可不得转载;否则,将追究其法律责任。
Coreseek, Sphinx, Ubuntu Server, PHP, MySQL
Coreseek, Sphinx, Ubuntu Server, PHP, MySQL
页:
[1]