广州市德数机械设备有限公司 ── 专业研发、设计、生产贴标机/不干胶贴标机/包装机/包装生产线/定制非标设备

德云社区

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

带盖棕色半透明口服液圆形小玻璃瓶
折叠白色、黄色瓦楞纸箱
黑色塑料瓶盖化妆品透明玻璃瓶
黄色纸盒
矩形化妆品透明小玻璃瓶
红色液态生料带瓶
蓝色标签塑料软管
辉瑞伟哥包装小纸盒
查看: 2593|回复: 2

在 Ubuntu Server 14.04 下安装中文全文搜索引擎 Coreseek 4.1-beta

[复制链接]

189

主题

299

帖子

1211

积分

版主

Rank: 7Rank: 7Rank: 7

金钱
687
金币
13
威望
0
贡献
0
发表于 2015-1-3 03:07:59 | 显示全部楼层 |阅读模式
|          
在 Ubuntu Server 14.04 下安装中文全文搜索引擎 Coreseek 4.1-beta

Coreseek 是一款可供企业使用的中文全文 “检索/搜索” 软件,以 GPL2 许可协议开源发布;基于 Sphinx 研发并独立发布,专攻中文搜索和信息处理领域。适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景,可以免费下载使用。商业使用(譬如:嵌入到其他程序中)需要获得商业授权。


SphinxSQL Phrase Index 的缩写,但不幸的是和 CMUSphinx 项目重名。


Coreseek 的意图:为其他应用提供高速、低空间占用、高相关度结果的中文全文搜索能力。CoreSeek 可以非常容易的与 SQL 数据库和脚本语言集成。


01、安装 Ubuntu Server 14.04 编译工具包
  1. root:# apt-get install make gcc g++ automake libtool mysql-client libmysqlclient-dev libxml2-dev libexpat1-dev

  2. #若数据库为 MariaDB
  3. root:# apt-get install make gcc g++ automake libtool mariadb-client libmysqlclient-dev libxml2-dev libexpat1-dev
复制代码
02、下载、解压 Coreseek 4.1-beta 安装包
  1. root:# cd /var
  2. root:/var# wget http://www.coreseek.cn/uploads/csft/4.0/coreseek-4.1-beta.tar.gz
  3. --2015-01-03 04:00:39--  http://www.coreseek.cn/uploads/csft/4.0/coreseek-4.1-beta.tar.gz
  4. 正在解析主机 www.coreseek.cn (www.coreseek.cn)... 219.234.93.160
  5. 正在连接 www.coreseek.cn (www.coreseek.cn)|219.234.93.160|:80... 已连接。
  6. 已发出 HTTP 请求,正在等待回应... 301 Moved Permanently
  7. 位置:http://219.232.239.243/uploads/csft/4.0/coreseek-4.1-beta.tar.gz [跟随至新的 URL]
  8. --2015-01-03 04:00:39--  http://219.232.239.243/uploads/csft/4.0/coreseek-4.1-beta.tar.gz
  9. 正在连接 219.232.239.243:80... 已连接。
  10. 已发出 HTTP 请求,正在等待回应... 200 OK
  11. 长度: 9157146 (8.7M) [application/x-gzip]
  12. 正在保存至: “coreseek-4.1-beta.tar.gz”

  13. 100%[================================================================================>] 9,157,146    344KB/s   用时 27s  

  14. 2015-01-03 04:01:07 (327 KB/s) - 已保存 “coreseek-4.1-beta.tar.gz” [9157146/9157146])

  15. root:/var#tar zxvf coreseek-4.1-beta.tar.gz
复制代码
03、安装 mmseg-3.2.14 中文分词
  1. root:/var# cd /var/coreseek-4.1-beta/mmseg-3.2.14
  2. root:/var/coreseek-4.1-beta/mmseg-3.2.14# ./bootstrap
  3. root:/var/coreseek-4.1-beta/mmseg-3.2.14# ./configure --prefix=/usr/local/mmseg3    #配置 mmseg-3.2.14
  4. root:/var/coreseek-4.1-beta/mmseg-3.2.14# make && make install    #编译、安装 mmseg-3.2.14
复制代码
04、中文分词测试

若显示乱码,请检查系统 locale 本地环境 zh_CN.UTF-8 设置

  1. root:/var/coreseek-4.1-beta/mmseg-3.2.14# /usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc /var/coreseek-4.1-beta/mmseg-3.2.14/src/t1.txt
  2. 中文/x 分/x 词/x 测试/x
  3. 中国人/x 上海市/x

  4. Word Splite took: 0 ms.
  5. root:/var/coreseek-4.1-beta/mmseg-3.2.14#
复制代码
05、安装 Coreseek-4.1-beta 搜索
  1. root:/var/coreseek-4.1-beta/mmseg-3.2.14# cd /var/coreseek-4.1-beta/csft-4.1
  2. root:/var/coreseek-4.1-beta/csft-4.1# sh buildconf.sh
  3. root:/var/coreseek-4.1-beta/csft-4.1# ./configure --prefix=/usr/local/coreseek --without-unixodbc --with-mmseg --with-mmseg-includes=/usr/local/mmseg3/include/mmseg/ --with-mmseg-libs=/usr/local/mmseg3/lib/ --with-mysql    #配置 coreseek-4.1-beta
  4. root:/var/coreseek-4.1-beta/csft-4.1# make && make install    #编译、安装 mmseg-3.2.14
复制代码
06、测试 mmseg-3.2.14 中文分词,coreseek-4.1-beta 搜索
  1. root:/var/coreseek-4.1-beta/csft-4.1# cat /var/coreseek-4.1-beta/testpack/var/test/test.xml
  2. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/mmseg3/bin/mmseg -d /usr/local/mmseg3/etc /var/coreseek-4.1-beta/testpack/var/test/test.xml
  3. </x ?/x xml/x  /x version/x =/x "/x 1/x ./x 0/x "/x  /x encoding/x =/x "/x utf/x -/x 8/x "/x ?/x >/x
  4. </x sphinx/x :/x docset/x >/x
  5.     /x </x sphinx/x :/x schema/x >/x
  6.     /x </x sphinx/x :/x field/x  /x name/x =/x "/x subject/x "/x //x >/x  /x
  7.     /x </x sphinx/x :/x field/x  /x name/x =/x "/x content/x "/x //x >/x
  8.     /x </x sphinx/x :/x attr/x  /x name/x =/x "/x published/x "/x  /x type/x =/x "/x timestamp/x "/x //x >/x
  9.     /x </x sphinx/x :/x attr/x  /x name/x =/x "/x author/x _/x id/x "/x  /x type/x =/x "/x int/x "/x  /x bits/x =/x "/x 16/x "/x  /x default/x =/x "/x 1/x "/x //x >/x
  10.     /x </x //x sphinx/x :/x schema/x >/x
  11.     /x </x sphinx/x :/x document/x  /x id/x =/x "/x 1/x "/x >/x
  12.     /x     /x </x subject/x >/x 愚人/x 节/x 最佳/x 蛊惑/x 爆/x 料/x  /x 谷/x 歌/x 300/x 亿/x 美元/x 收购/x 百/x 度/x </x //x subject/x >/x
  13.     /x     /x </x published/x >/x 1270131607/x </x //x published/x >/x
  14.     /x     /x </x content/x >/x 据/x 国外/x 媒体/x 报道/x ,/x 谷/x 歌/x 将/x 巨资/x 收购/x 百/x 度/x ,/x 涉及/x 金额/x 高达/x 300/x 亿/x 美元/x 。/x 谷/x 歌/x 借/x 此/x 重返/x 大陆/x 市场/x 。/x
  15.  /x  /x 该/x 报道/x 称/x ,/x 目前/x 谷/x 歌/x 与/x 百/x 度/x 已经/x 达成/x 了/x 收购/x 协议/x ,/x 将/x 择机/x 对外/x 公布/x 。/x 百/x 度/x 的/x 管理层/x 将/x 100/x %/x 保留/x ,/x 但/x 会/x 将/x 项目/x 缩减/x ,/x 包括/x 有/x 啊/x 商城/x ,/x 以及/x 目前/x 实施/x 不力/x 的/x 凤/x 巢/x 计划/x 。/x 正在/x 进行/x 测试/x 阶段/x 的/x 视频/x 网站/x qiyi/x ./x com/x 将/x 输入/x 更/x 多/x 的/x Youtube/x 资源/x 。/x (/x YouTube/x 在/x 大陆/x 区/x 因/x 内容/x 审查/x 暂/x 不/x 能/x 访问/x )/x 。/x
  16.  /x  /x 该/x 消息/x 似乎/x 得到/x 了/x 谷/x 歌/x CEO/x 施/x 密/x 特/x 的/x 确认/x ,/x 在/x 其/x twitter/x 上/x 用/x 简短/x 而/x 暧昧/x 的/x 文字/x 进行/x 了/x 表述/x :/x “/x  /x Withdraw/x  /x from/x  /x that/x  /x market/x ?/x  /x u/x '/x ll/x  /x also/x  /x see/x  /x another/x  /x result/x ,/x  /x just/x  /x wait/x ./x ./x ./x  /x ”/x  /x 意思/x 是/x :/x 从/x 那个/x 市场/x 退出/x ?/x 你/x 还/x 会/x 看到/x 另外/x 一个/x 结果/x 。/x 毫无疑问/x ,/x 那个/x 市场/x 指/x 的/x 就是/x 中国/x 大陆/x 。/x 而/x 另外/x 的/x 结果/x ,/x 对应/x 此/x 媒体/x 报道/x ,/x 就是/x 收购/x 百/x 度/x ,/x 从而/x 曲线/x 返回/x 大陆/x 搜索/x 市场/x 。/x
  17.  /x  /x 在/x 最近/x 刚刚/x 结束/x 的/x 深圳/x IT/x 领袖/x 峰/x 会上/x ,/x 李/x 彦/x 宏/x 曾/x 言/x ,/x “/x 谷/x 歌/x 没有/x 退出/x 中国/x ,/x 因为/x 还/x 在/x 香港/x ”/x 。/x 也/x 似乎/x 在/x 验证/x 被/x 收购/x 的/x 这/x 一/x 事实/x 。/x
  18.  /x  /x 截止/x 发稿/x ,/x 百/x 度/x 的/x 股价/x 为/x 597/x 美元/x ,/x 市值/x 为/x 207/x 亿/x 美元/x 。/x 谷/x 歌/x 以/x 高达/x 300/x 亿/x 美元/x 的/x 价格/x ,/x 实际/x 溢价/x 高达/x 50/x %/x 。/x 而/x 谷/x 歌/x 市值/x 高达/x 1796/x 亿/x 美元/x ,/x 而且/x 手/x 握/x 大量/x 现金/x ,/x 作/x 这样/x 的/x 决策/x 也/x 在/x 情理之中/x 。/x
  19. /x  /x  /x  /x 近日/x ,/x 很多/x 媒体/x 都/x 在/x 报道/x 百/x 度/x 创始人/x 、/x CEO/x 李/x 彦/x 宏/x 的/x 两/x 次/x 拒/x 购/x :/x 一/x 次/x 是/x 百/x 度/x 上市/x 前夕/x ,/x 李/x 彦/x 宏/x 拒绝/x 谷/x 歌/x 的/x 并购/x ,/x 这个/x 细节/x 在/x 2/x 月/x 28/x 日/x 央视/x 虎年/x 首/x 期/x 对话/x 节目/x 中/x 得到/x 首次/x 披露/x ﹔/x 一/x 次/x 是/x 在/x 百/x 度/x 国际化/x 战略/x 中/x ,/x 拒绝/x 采用/x 海外/x 并购/x 的/x 方式/x ,/x 而是/x 采取/x 了/x 从/x 日本/x 市场/x 开始/x 的/x 海外/x 自主/x 发展/x 之/x 路/x 。/x 这/x 也/x 让/x 笔者/x 由此/x 开始/x 思考/x 民族/x 品牌/x 的/x 发展/x 之/x 路/x 。/x  /x
  20.  /x  /x 收购/x 是/x 打/x 压/x 中国/x 品牌/x 的/x 惯用/x 伎俩/x
  21.  /x  /x 2010/x 年/x 2/x 月/x 28/x 日/x ,/x 央视/x 经济/x 频道/x 《/x 对话/x 》/x 节目/x 昨晚/x 推出/x 虎年/x 首/x 期/x 节目/x ,/x 百/x 度/x 董事长/x 兼/x CEO/x 李/x 彦/x 宏/x 作为/x 嘉宾/x 做客/x 节目/x 。/x 李/x 彦/x 宏/x 首度/x 谈及/x 2005/x 年/x 百/x 度/x 上市/x 前夕/x ,/x 谷/x 歌/x CEO/x 施/x 密/x 特/x 曾/x 秘密/x 造访/x 百/x 度/x 时/x 秘密/x 谈话/x 的/x 内容/x ,/x 主要/x 是/x 劝阻/x 百/x 度/x 上市/x ,/x 李/x 彦/x 宏/x 断然/x 拒绝/x 了/x 施/x 密/x 特/x 的/x “/x 好意/x ”/x 。/x 今天/x 看来/x ,/x 施/x 密/x 特/x 当日/x 也许/x 已/x 有/x 不祥/x 的/x 预感/x ,/x 这个/x 几/x 百/x 人/x 的/x 小/x 公司/x 终/x 有/x 一日/x 会/x 成为/x 他们/x 的/x 大/x 麻烦/x 。/x
  22.  /x  /x 本期/x 《/x 对话/x 》/x 一经/x 播出/x ,/x 便/x 引发/x 了/x 业界/x 讨论/x 。/x
  23.  /x  /x 外资/x 品牌/x 通过/x 收购/x 打/x 压/x 中国/x 品牌/x 的/x 案例/x 不胜枚举/x 。/x 从/x 以往/x 跨国/x 企业/x 并购/x 的/x 中国/x 品牌/x 来看/x ,/x 真正/x 让/x 其/x 活/x 下来/x 的/x 品牌/x 并不/x 多/x ,/x 要么/x 被/x 雪/x 藏/x ,/x 要么/x 被/x 低/x 端/x 化/x 。/x
  24.  /x  /x 因此/x ,/x 2005/x 年/x 百/x 度/x 没有/x 接受/x Google/x 的/x 收购/x 邀请/x ,/x 坚持/x 自主/x 发展/x ,/x 这/x 对于/x 保护/x 中国/x 品牌/x ,/x 维护/x 中国/x 网/x 民/x 信息/x 安全/x 有着/x 至关重要/x 的/x 作用/x 。/x 当前/x 百/x 度/x 市场/x 份额/x 高达/x 76/x %/x ,/x 并/x 持续/x 增长/x ,/x 这/x 也/x 充分/x 验证/x 了/x 李/x 彦/x 宏/x 拒绝/x 收购/x 决策/x 的/x 正确性/x 。/x
  25.  /x  /x 今天/x 看来/x ,/x “/x 百/x 度/x 一下/x ”/x 已经/x 成为/x 3/x 亿/x 多/x 中国/x 网/x 民/x 的/x 网络/x 生存/x 法则/x ,/x 而/x 直到/x 今天/x 环视/x 全球/x ,/x 真正/x 能/x 像/x 中国/x 一样/x ,/x 拥有/x 自己/x 独立/x 搜索引擎/x 的/x 只有/x 4/x 个/x 国家/x !/x 我们/x 也许/x 应该/x 庆幸/x 当时/x 李/x 彦/x 宏/x 的/x 选择/x 。/x 这个/x 故事/x 也/x 告诉/x 我们/x ,/x 中国/x 企业/x 做/x 品牌/x 还要/x 靠/x 自己/x !/x
  26.  /x  /x 收购/x 也/x 可能/x 是/x 中国/x 企业/x 走/x 出去/x 的/x 陷阱/x
  27.  /x  /x 同样/x 在/x 2/x 月/x 28/x 日/x ,/x 亚布力/x 第/x 十/x 届/x 年/x 会上/x ,/x 李/x 彦/x 宏/x 在/x 论坛/x 上/x 指出/x :/x “/x 我们/x 和/x 很多/x 其它/x 公司/x 的/x 国际化/x 路子/x 是/x 很/x 不/x 一样/x 的/x ,/x 我们/x 不/x 是/x 去/x 买/x 一个/x 国外/x 的/x 公司/x ,/x ”/x ,/x 李/x 彦/x 宏/x 解释/x 了/x 百/x 度/x 率先/x 选择/x 日本/x 作为/x 走/x 出去/x 的/x 对象/x 的/x 原因/x ,/x 因为/x 日本/x 和/x 中国/x 一衣带水/x 的/x 近邻/x 优势/x ,/x 日本/x 的/x 市场/x 规模/x ,/x 在/x 日本/x 也/x 没有/x 一家/x 独/x 大/x 的/x 搜索引擎/x 。/x
  28.  /x  /x 中国/x 企业/x 收购/x 这些/x 外资/x 品牌/x 目的/x 是/x “/x 借/x 船/x 出海/x ”/x 。/x 外资/x 品牌/x 进入/x 中/x 国是/x 收购/x 中国/x 优质/x 品牌/x ,/x 而/x 中国/x 企业/x 进入/x 国外/x 市场/x 的/x 收购/x 策略/x 恰恰相反/x ,/x 这/x 也/x 是/x 中国/x 企业/x 借/x 船/x 出海/x 屡屡/x 失败/x 的/x 原因/x 所在/x 。/x
  29.  /x  /x 笔者/x 认为/x ,/x 中国/x 互联网/x 公司/x 走/x 出去/x 要/x 依靠/x 自身/x 发展/x ,/x 并不/x 能/x 单纯/x 依靠/x 收购/x 。/x 李/x 彦/x 宏/x 在/x 百/x 度/x 成立/x 伊始/x 就/x 抱定/x 了/x 国际化/x 决心/x ,/x 使/x 百/x 度/x 真正/x 在/x 面对/x 国际化/x 机遇/x 时/x ,/x 更加/x 冷静/x 和/x 具有/x 前瞻/x 力/x 。/x 李/x 彦/x 宏/x 也/x 承认/x 当前/x 百/x 度/x 在/x 日本/x 还/x 处于/x 初级/x 发展/x 阶段/x ,/x 但/x 他/x 也/x 预言/x “/x 2012/x 年/x ,/x 百/x 度/x 与/x Google/x 划/x 洋/x 而/x 治/x ”/x ,/x 对此/x 我们/x 拭目以待/x !/x
  30.     /x     /x </x //x content/x >/x
  31.     /x     /x </x author/x _/x id/x >/x 1/x </x //x author/x _/x id/x >/x
  32.     /x </x //x sphinx/x :/x document/x >/x
  33.     /x </x sphinx/x :/x document/x  /x id/x =/x "/x 2/x "/x >/x
  34.     /x     /x </x subject/x >/x Twitter/x 主页/x 改版/x  /x 推/x 普通/x 用户/x 消息/x 增加/x 趋势/x 话题/x </x //x subject/x >/x
  35.     /x     /x </x published/x >/x 1270135548/x </x //x published/x >/x
  36.     /x     /x </x content/x >/x 4/x 月/x 1/x 日/x 消息/x ,/x 据/x 国外/x 媒体/x 报道/x ,/x Twitter/x 本/x 周二/x 推出/x 新版/x 主页/x ,/x 目的/x 很/x 简单/x :/x 帮助/x 新/x 用户/x 了解/x Twitter/x 和/x 增加/x 用户/x 黏稠度/x 。/x
  37.  /x  /x 新版/x Twittter/x 入口处/x 的/x 内容/x 眼花缭乱/x ,/x 在/x 头部/x 下方/x 有/x 滚动/x 的/x 热门/x 趋势/x 话题/x ,/x 左边/x 列出/x 了/x 普通/x 用户/x 账户/x 和/x 他们/x 最新/x 的/x 消息/x 。/x
  38.  /x  /x 另/x 一个/x 显著/x 的/x 部分/x 是/x “/x Top/x  /x Tweets/x ”/x ,/x 它/x 采用/x 了/x 新/x 算法/x 推选/x 出/x 最/x 热门/x 的/x 话题/x ,/x 每个/x 几/x 秒/x 刷新/x 一/x 次/x 。/x Twitter/x 首席/x 科学家/x Abdur/x  /x Chowdhury/x 表示/x ,/x 这种/x 算法/x 选出/x 了/x 所有/x 用户/x 的/x 信息/x ,/x 而/x 不/x 是/x 拥有/x 大量/x 追随者/x 所/x 发/x 的/x 信息/x 。/x
  39.  /x  /x 首/x 页/x 对于/x 首次/x 访问/x 网站/x 的/x 用户/x 非常/x 重要/x ,/x 因为/x 这/x 决定/x 了/x 用户/x 的/x 第一/x 印象/x 。/x 研究/x 发现/x ,/x 多/x 达/x 60/x %/x 的/x Twittter/x 用户/x 在/x 注册/x 后/x 的/x 一个/x 月/x 内/x 不再/x 访问/x 网站/x 。/x Twittter/x 希望/x 能/x 更/x 好/x 地/x 展现/x 网站/x 的/x 面貌/x ,/x 帮助/x 游客/x 找到/x 感/x 兴趣/x 的/x 东西/x 。/x
  40.     /x     /x </x //x content/x >/x
  41.     /x     /x </x author/x _/x id/x >/x 1/x </x //x author/x _/x id/x >/x
  42.     /x </x //x sphinx/x :/x document/x >/x
  43.     /x </x sphinx/x :/x document/x  /x id/x =/x "/x 3/x "/x >/x
  44.     /x     /x </x subject/x >/x 死/x 都/x 要/x 上/x !/x Opera/x  /x Mini/x  /x 体验/x 版/x 抢先/x 试用/x </x //x subject/x >/x
  45.     /x     /x </x published/x >/x 1270094460/x </x //x published/x >/x
  46.     /x     /x </x content/x >/x Opera/x 一直/x 都/x 被/x 认为/x 是/x 浏览/x 速度/x 飞快/x ,/x 同时/x 在/x 移动/x 平台/x 上/x 更/x 是/x 占有/x 不少/x 的/x 份额/x 。/x 不久前/x ,/x Opera/x 正式/x 向/x 苹果/x 提交/x 了/x 针对/x iPhone/x 设计/x 的/x Opera/x  /x Mini/x 。/x 日前/x ,/x 台湾/x IT/x 网站/x 放出/x 了/x Opera/x  /x Mini/x 和/x Safari/x 的/x 评测/x 文章/x ,/x 下面/x 让/x 我们/x 看看/x Opera/x 和/x Safari/x 到底/x 谁/x 更/x 好/x 用/x 更/x 快/x 吧/x 。/x
  47.  /x  /x Opera/x  /x Mini/x  /x VS/x  /x Safari/x ,/x 显示/x 方式/x 很/x 不/x 相同/x
  48. 和/x Safari/x 不同/x 的/x 是/x ,/x Opera/x  /x Mini/x 会/x 针对/x 手机/x 对/x 网页/x 进行/x 一些/x 调整/x
  49.  /x  /x Opera/x  /x Mini/x 与/x Safari/x 的/x 运作/x 原理/x 不大/x 相同/x 。/x 网页/x 会/x 通过/x Opera/x 的/x 服务器/x 完整/x 压缩/x 后/x 再/x 发送/x 到手/x 机上/x ,/x 不/x 像/x Safari/x 可/x 通过/x Multi/x -/x Touch/x 和/x 点/x 击/x 的/x 方式/x 自由/x 缩/x 放/x ,/x Opera/x  /x Mini/x 会/x 预先/x 将/x 文字/x 照/x iPhone/x 的/x 宽度/x 做好/x 调整/x ,/x 点/x 击/x 区域/x 后/x 自动/x 放大/x 。/x 如果/x 习惯/x 了/x Safari/x 的/x 浏览/x 方式/x ,/x 会/x 感觉/x 不大/x 顺手/x ,/x 不过/x 对/x 许多/x 宽度/x 太/x 宽/x ,/x 缩/x 放/x 后/x 文字/x 仍然/x 显示/x 很/x 小/x 的/x 网页/x 来说/x ,/x Opera/x  /x Mini/x 的/x 显示/x 方式/x 比较/x 有/x 优势/x 。/x
  50.  /x  /x 打开/x 测试/x 网站/x 首/x 页/x 所/x 花费/x 的/x 流量/x ,/x Safari/x 和/x Opera/x  /x Mini/x 的/x 差距/x 明显/x 可见/x 。/x 这个/x 在/x 国内/x 移动/x 资费/x 超高/x 的/x 局面/x 来说/x ,/x Opera/x  /x Mini/x 估计/x 会/x 比较/x 受/x 欢迎/x 和/x 省钱/x 。/x
  51. Opera/x  /x Mini/x 的/x 流量/x 少/x 得/x 惊人/x ,/x 仅/x 是/x Safari/x 的/x 十分/x 之一/x
  52.  /x  /x 兼容性/x 相比/x ,/x Safari/x 完/x 胜/x
  53. 打开/x Google/x 首/x 页/x ,/x Safari/x 上/x 是/x iPhone/x 专用/x 界面/x ,/x Opera/x 则/x 是/x 一般/x 移动/x 版本/x
  54.  /x  /x Opera/x  /x Mini/x 的/x 速度/x 和/x 省/x 流量/x 还是/x 无法/x 取代/x Safari/x 成为/x iPhone/x 上/x 的/x 主要/x 浏览器/x 。/x 毕竟/x iPhone/x 的/x 高/x 占有率/x 让/x 许多/x 网站/x ,/x 线/x 上/x 服务/x 都/x 为/x Safari/x 设计/x 了/x 专用/x 页面/x 。/x 光/x Google/x 的/x 首/x 页/x 为/x 例子/x 就/x 看出/x 了/x 明显/x 的/x 差别/x 。/x 另外/x ,/x 像/x Google/x  /x Buzz/x 这样/x 线/x 上/x 应用/x ,/x 就/x 会/x 出现/x 显示/x 错误/x 。/x
  55. Google/x  /x Buzz/x 上/x ,/x Opera/x 无法/x 输入/x 内容/x
  56.  /x  /x Opera/x  /x Mini/x 其他/x 专属/x 功能/x
  57. 页面/x 内/x 搜索/x 和/x 关键字/x 直接/x 搜索/x 相当/x 人性化/x
  58.  /x  /x 除了/x Opera/x 独创/x 的/x Speed/x  /x Dial/x 九宫/x 格/x 快速/x 启动/x 页面/x 外/x ,/x 和/x Opera/x  /x Link/x 和/x 电脑/x 上/x 的/x Opera/x 直接/x 同步/x 书签/x 、/x Speed/x  /x Dial/x 设定/x 外/x 。/x Opera/x  /x Mini/x 还/x 能够/x 直接/x 搜索/x 页面/x 中/x 的/x 文字/x ,/x 查找/x 资料/x 时/x 相当/x 方便/x 。/x 另外/x 也/x 能/x 选取/x 文字/x 另/x 开/x 新/x 分/x 页/x 搜索/x ,/x 比起/x Safari/x 还要/x 复制/x 、/x 开/x 新/x 页/x 、/x 粘贴/x 简单/x 许多/x 。/x 同时/x 还/x 能/x 将/x 整个/x 页面/x 打包/x 存储/x ,/x 方便/x 离/x 线/x 浏览/x 。/x
  59.  /x  /x 现在/x Opera/x  /x Mini/x 想/x 要/x 打败/x Safari/x 还/x 剩下/x 一个/x 很/x 严重/x 的/x 问题/x -/x 苹果/x 何时/x 会/x 或者/x 会/x 不/x 会/x 通过/x Opera/x  /x Mini/x 的/x 审核/x 。/x
  60.     /x     /x </x //x content/x >/x
  61.     /x     /x </x author/x _/x id/x >/x 2/x </x //x author/x _/x id/x >/x
  62.     /x </x //x sphinx/x :/x document/x >/x
  63. </x //x sphinx/x :/x docset/x >/x

  64. Word Splite took: 4 ms.
  65. root:/var/coreseek-4.1-beta/csft-4.1#
复制代码
07、修改配置文件
  1. vi /var/coreseek-4.1-beta/testpack/etc/csft.conf
复制代码

修改后的配置文件内容:

  1. #XML数据源配置,详情请查看:http://www.coreseek.cn/products-install/datasource/

  2. #源定义
  3. source xml
  4. {
  5.     type                    = xmlpipe2
  6.     xmlpipe_command = cat /usr/local/coreseek/var/test/test.xml
  7.     #请修改为实际使用的绝对路径,例如:cat /usr/local/coreseek/var/...
  8. }

  9. #index定义
  10. index xml
  11. {
  12.     source            = xml            #对应的source名称
  13.     path            = /usr/local/coreseek/var/data/xml #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
  14.     docinfo            = extern
  15.     mlock            = 0
  16.     morphology        = none
  17.     min_word_len        = 1
  18.     html_strip                = 0

  19.     #中文分词配置,详情请查看:http://www.coreseek.cn/products-install/coreseek_mmseg/
  20.     charset_dictpath = /usr/local/mmseg3/etc/ #BSD、Linux环境下设置,/符号结尾
  21.     #charset_dictpath = etc/                             #Windows环境下设置,/符号结尾,最好给出绝对路径,例如:C:/usr/local/coreseek/etc/...
  22.     charset_type        = zh_cn.utf-8
  23. }

  24. #全局index定义
  25. indexer
  26. {
  27.     mem_limit            = 128M    #内存使用限制
  28. }

  29. #searchd服务定义
  30. searchd
  31. {
  32.     listen                  =   9312
  33.     read_timeout        = 5
  34.     max_children        = 30
  35.     max_matches            = 1000
  36.     seamless_rotate        = 0
  37.     preopen_indexes        = 0
  38.     unlink_old            = 1
  39.     pid_file = /usr/local/coreseek/var/log/searchd_xml.pid   #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
  40.     log = /usr/local/coreseek/var/log/searchd_xml.log        #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
  41.     query_log = /usr/local/coreseek/var/log/query_xml.log    #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
  42.     binlog_path =                                            #关闭 binlog 日志
  43. }
复制代码
  1. vi /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf
复制代码

修改后的配置文件内容:

  1. #MySQL数据源配置,详情请查看:http://www.coreseek.cn/products-install/mysql/
  2. #请先将var/test/documents.sql导入数据库,并配置好以下的MySQL用户密码数据库

  3. #源定义
  4. source mysql
  5. {
  6.     type                    = mysql

  7.     sql_host                = localhost
  8.     sql_user                = root                      #MySQL 管理员 root 用户
  9.     sql_pass                = xxxxxxxxxxxx    #root 用户密码
  10.     sql_db                   = documents           #MySQL 数据库名称
  11.     sql_port                = 3306                     #MySQL 数据库端口
  12.     sql_query_pre           = SET NAMES utf8

  13.     sql_query                = SELECT id, group_id, UNIX_TIMESTAMP(date_added) AS date_added, title, content FROM documents
  14.                                                               #sql_query第一列id需为整数
  15.                                                               #title、content作为字符串/文本字段,被全文索引
  16.     sql_attr_uint            = group_id           #从SQL读取到的值必须为整数
  17.     sql_attr_timestamp        = date_added #从SQL读取到的值必须为整数,作为时间属性

  18.     sql_query_info_pre      = SET NAMES utf8                                        #命令行查询时,设置正确的字符集
  19.     sql_query_info            = SELECT * FROM documents WHERE id=$id #命令行查询时,从数据库读取原始数据信息
  20. }

  21. #index定义
  22. index mysql
  23. {
  24.     source            = mysql             #对应的source名称
  25.     path            = /usr/local/coreseek/var/data/mysql    #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
  26.     docinfo            = extern
  27.     mlock            = 0
  28.     morphology        = none
  29.     min_word_len        = 1
  30.     html_strip                = 0

  31.     #中文分词配置,详情请查看:http://www.coreseek.cn/products-install/coreseek_mmseg/
  32.     charset_dictpath = /usr/local/mmseg3/etc/ #BSD、Linux环境下设置,/符号结尾
  33.     #charset_dictpath = etc/                             #Windows环境下设置,/符号结尾,最好给出绝对路径,例如:C:/usr/local/coreseek/etc/...
  34.     charset_type        = zh_cn.utf-8
  35. }

  36. #全局index定义
  37. indexer
  38. {
  39.     mem_limit            = 128M    #内存使用限制
  40. }

  41. #searchd服务定义
  42. searchd
  43. {
  44.     listen                  =   9312
  45.     read_timeout        = 5
  46.     max_children        = 30
  47.     max_matches            = 1000
  48.     seamless_rotate        = 0
  49.     preopen_indexes        = 0
  50.     unlink_old            = 1
  51.     pid_file = /usr/local/coreseek/var/log/searchd_mysql.pid      #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
  52.     log = /usr/local/coreseek/var/log/searchd_mysql.log            #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
  53.     query_log = /usr/local/coreseek/var/log/query_mysql.log    #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
  54.     binlog_path =                                                                      #关闭 binlog 日志
  55. }
复制代码
08、 创建数据库 documents,导入备份数据
  1. root:/var/coreseek-4.1-beta/csft-4.1# mysql -u root -p
  2. Enter password:                               #键入 MariaDB 或 MySQL 的 root 用户密码
  3. Welcome to the MariaDB monitor.  Commands end with ; or \g.
  4. Your MariaDB connection id is 457
  5. Server version: 5.5.40-MariaDB-0ubuntu0.14.04.1 (Ubuntu)

  6. Copyright (c) 2000, 2014, Oracle, Monty Program Ab and others.

  7. Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.

  8. MariaDB [(none)]> create database documents;    #创建数据库
  9. Query OK, 1 row affected (0.00 sec)

  10. MariaDB [(none)]> use documents;                       #切换数据库
  11. Database changed
  12. MariaDB [documents]> source  /var/coreseek-4.1-beta/testpack/var/test/documents.sql;     #导入数据库备份数据
  13. Query OK, 0 rows affected (0.00 sec)

  14. Query OK, 0 rows affected (0.00 sec)

  15. Query OK, 0 rows affected (0.00 sec)

  16. Query OK, 0 rows affected (0.00 sec)

  17. Query OK, 0 rows affected (0.00 sec)

  18. Query OK, 0 rows affected, 1 warning (0.00 sec)

  19. Query OK, 0 rows affected (0.03 sec)

  20. Query OK, 3 rows affected (0.00 sec)
  21. Records: 3  Duplicates: 0  Warnings: 0

  22. MariaDB [documents]> exit      #退出数据库
  23. Bye
  24. root:/var/coreseek-4.1-beta/csft-4.1#
复制代码
09、 查看索引配置是否可以正确运行
  1. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf
  2. Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
  3. Copyright (c) 2007-2011,
  4. Beijing Choice Software Technologies Inc (http://www.coreseek.com)

  5. ERROR: nothing to do.
  6. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /var/coreseek-4.1-beta/testpack/etc/csft.conf
  7. Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
  8. Copyright (c) 2007-2011,
  9. Beijing Choice Software Technologies Inc ([url]http://www.coreseek.com[/url])

  10. ERROR: nothing to do.
  11. root:/var/coreseek-4.1-beta/csft-4.1#
复制代码
10、 查看正常索引全部数据时的提示信息
  1. root:/var/coreseek-4.1-beta/csft-4.1# mkdir /usr/local/coreseek/var/test
  2. root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/var/test/test.xml /usr/local/coreseek/var/test/test.xml
  3. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf --all
  4. Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
  5. Copyright (c) 2007-2011,
  6. Beijing Choice Software Technologies Inc (http://www.coreseek.com)

  7. using config file '/var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf'...
  8. indexing index 'mysql'...
  9. collected 3 docs, 0.0 MB
  10. sorted 0.0 Mhits, 100.0% done
  11. total 3 docs, 7545 bytes
  12. total 0.012 sec, 607048 bytes/sec, 241.37 docs/sec
  13. total 3 reads, 0.000 sec, 2.8 kb/call avg, 0.2 msec/call avg
  14. total 9 writes, 0.000 sec, 2.2 kb/call avg, 0.0 msec/call avg
  15. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /var/coreseek-4.1-beta/testpack/etc/csft.conf --all
  16. Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
  17. Copyright (c) 2007-2011,
  18. Beijing Choice Software Technologies Inc (http://www.coreseek.com)

  19. using config file '/var/coreseek-4.1-beta/testpack/etc/csft.conf'...
  20. indexing index 'xml'...
  21. collected 3 docs, 0.0 MB
  22. sorted 0.0 Mhits, 100.0% done
  23. total 3 docs, 7585 bytes
  24. total 0.008 sec, 932390 bytes/sec, 368.77 docs/sec
  25. total 3 reads, 0.000 sec, 2.8 kb/call avg, 0.0 msec/call avg
  26. total 9 writes, 0.000 sec, 2.2 kb/call avg, 0.0 msec/call avg
  27. root:/var/coreseek-4.1-beta/csft-4.1#
复制代码
11、查看无关键词,正常搜索时的提示信息
  1. root@npt-Aspire-4920:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/search -c /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf
  2. Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
  3. Copyright (c) 2007-2011,
  4. Beijing Choice Software Technologies Inc ([url]http://www.coreseek.com[/url])

  5. using config file '/var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf'...
  6. index 'mysql': query '': returned 3 matches of 3 total in 0.000 sec

  7. displaying matches:
  8. 1. document=1, weight=1, group_id=2, date_added=Thu Apr  1 22:20:07 2010
  9.     id=1
  10.     title=愚人节最佳蛊惑爆料 谷歌300亿美元收购百度
  11.     content=据国外媒体报道,谷歌将巨资收购百度,涉及金额高达300亿美元。谷歌借此重返大陆市场。  该报道称,目前谷歌与百度已经达成了收购协议,将择机对外公布。百度的管理层将100%保留,但会将项目缩减,包括有啊商城,以及目前实施不力的凤巢计划。正在进行测试阶段的视频网站qiyi.com将输入更多的Youtube资源。(YouTube在大陆区因内容审查暂不能访问)。  该消息似乎得到了谷歌CEO施密特的确认,在其twitter上用简短而暧昧的文字进行了表述:“ Withdraw from that market? u'll also see another result, just wait... ” 意思是:从那个市场退出?你还会看到另外一个结果。毫无疑问,那个市场指的就是中国大陆。而另外的结果,对应此媒体报道,就是收购百度,从而曲线返回大陆搜索市场。  在最近刚刚结束的深圳IT领袖峰会上,李彦宏曾言,“谷歌没有退出中国,因为还在香港”。也似乎在验证被收购的这一事实。  截止发稿,百度的股价为597美元,市值为207亿美元。谷歌以高达300亿美元的价格,实际溢价高达50%。而谷歌市值高达1796亿美元,而且手握大量现金,作这样的决策也在情理之中。    近日,很多媒体都在报道百度创始人、CEO李彦宏的两次拒购:一次是百度上市前夕,李彦宏拒绝谷歌的并购,这个细节在2月28日央视虎年首期对话节目中得到首次披露﹔一次是在百度国际化战略中,拒绝采用海外并购的方式,而是采取了从日本市场开始的海外自主发展之路。这也让笔者由此开始思考民族品牌的发展之路。   收购是打压中国品牌的惯用伎俩  2010年2月28日,央视经济频道《对话》节目昨晚推出虎年首期节目,百度董事长兼CEO李彦宏作为嘉宾做客节目。李彦宏首度谈及2005年百度上市前夕,谷歌CEO施密特曾秘密造访百度时秘密谈话的内容,主要是劝阻百度上市,李彦宏断然拒绝了施密特的“好意”。今天看来,施密特当日也许已有不祥的预感,这个几百人的小公司终有一日会成为他们的大麻烦。  本期《对话》一经播出,便引发了业界讨论。  外资品牌通过收购打压中国品牌的案例不胜枚举。从以往跨国企业并购的中国品牌来看,真正让其活下来的品牌并不多,要么被雪藏,要么被低端化。  因此,2005年百度没有接受Google的收购邀请,坚持自主发展,这对于保护中国品牌,维护中国网民信息安全有着至关重要的作用。当前百度市场份额高达76%,并持续增长,这也充分验证了李彦宏拒绝收购决策的正确性。  今天看来,“百度一下”已经成为3亿多中国网民的网络生存法则,而直到今天环视全球,真正能像中国一样,拥有自己独立搜索引擎的只有4个国家!我们也许应该庆幸当时李彦宏的选择。这个故事也告诉我们,中国企业做品牌还要靠自己!  收购也可能是中国企业走出去的陷阱  同样在2月28日,亚布力第十届年会上,李彦宏在论坛上指出:“我们和很多其它公司的国际化路子是很不一样的,我们不是去买一个国外的公司,”,李彦宏解释了百度率先选择日本作为走出去的对象的原因,因为日本和中国一衣带水的近邻优势,日本的市场规模,在日本也没有一家独大的搜索引擎。  中国企业收购这些外资品牌目的是“借船出海”。外资品牌进入中国是收购中国优质品牌,而中国企业进入国外市场的收购策略恰恰相反,这也是中国企业借船出海屡屡失败的原因所在。  笔者认为,中国互联网公司走出去要依靠自身发展,并不能单纯依靠收购。李彦宏在百度成立伊始就抱定了国际化决心,使百度真正在面对国际化机遇时,更加冷静和具有前瞻力。李彦宏也承认当前百度在日本还处于初级发展阶段,但他也预言“2012年,百度与Google划洋而治”,对此我们拭目以待!
  12.     date_added=2010-04-01 22:20:07
  13.     author_id=1
  14.     group_id=2
  15. 2. document=2, weight=1, group_id=3, date_added=Thu Apr  1 23:25:48 2010
  16.     id=2
  17.     title=Twitter主页改版 推普通用户消息增加趋势话题
  18.     content=4月1日消息,据国外媒体报道,Twitter本周二推出新版主页,目的很简单:帮助新用户了解Twitter和增加用户黏稠度。  新版Twittter入口处的内容眼花缭乱,在头部下方有滚动的热门趋势话题,左边列出了普通用户账户和他们最新的消息。  另一个显著的部分是“Top Tweets”,它采用了新算法推选出最热门的话题,每个几秒刷新一次。Twitter首席科学家Abdur Chowdhury表示,这种算法选出了所有用户的信息,而不是拥有大量追随者所发的信息。  首页对于首次访问网站的用户非常重要,因为这决定了用户的第一印象。研究发现,多达60%的Twittter用户在注册后的一个月内不再访问网站。Twittter希望能更好地展现网站的面貌,帮助游客找到感兴趣的东西。
  19.     date_added=2010-04-01 23:25:48
  20.     author_id=1
  21.     group_id=3
  22. 3. document=3, weight=1, group_id=3, date_added=Thu Apr  1 12:01:00 2010
  23.     id=3
  24.     title=死都要上!Opera Mini 体验版抢先试用
  25.     content=Opera一直都被认为是浏览速度飞快,同时在移动平台上更是占有不少的份额。不久前,Opera正式向苹果提交了针对iPhone设计的Opera Mini。日前,台湾IT网站放出了Opera Mini和Safari的评测文章,下面让我们看看Opera和Safari到底谁更好用更快吧。  Opera Mini VS Safari,显示方式很不相同和Safari不同的是,Opera Mini会针对手机对网页进行一些调整  Opera Mini与Safari的运作原理不大相同。网页会通过Opera的服务器完整压缩后再发送到手机上,不像Safari可通过Multi-Touch和点击的方式自由缩放,Opera Mini会预先将文字照iPhone的宽度做好调整,点击区域后自动放大。如果习惯了Safari的浏览方式,会感觉不大顺手,不过对许多宽度太宽,缩放后文字仍然显示很小的网页来说,Opera Mini的显示方式比较有优势。  打开测试网站首页所花费的流量,Safari和Opera Mini的差距明显可见。这个在国内移动资费超高的局面来说,Opera Mini估计会比较受欢迎和省钱。Opera Mini的流量少得惊人,仅是Safari的十分之一  兼容性相比,Safari完胜打开Google首页,Safari上是iPhone专用界面,Opera则是一般移动版本  Opera Mini的速度和省流量还是无法取代Safari成为iPhone上的主要浏览器。毕竟iPhone的高占有率让许多网站,线上服务都为Safari设计了专用页面。光Google的首页为例子就看出了明显的差别。另外,像Google Buzz这样线上应用,就会出现显示错误。Google Buzz上,Opera无法输入内容  Opera Mini其他专属功能页面内搜索和关键字直接搜索相当人性化  除了Opera独创的Speed Dial九宫格快速启动页面外,和Opera Link和电脑上的Opera直接同步书签、Speed Dial设定外。Opera Mini还能够直接搜索页面中的文字,查找资料时相当方便。另外也能选取文字另开新分页搜索,比起Safari还要复制、开新页、粘贴简单许多。同时还能将整个页面打包存储,方便离线浏览。  现在Opera Mini想要打败Safari还剩下一个很严重的问题-苹果何时会或者会不会通过Opera Mini的审核。
  26.     date_added=2010-04-01 12:01:00
  27.     author_id=2
  28.     group_id=3

  29. words:

  30. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/search -c /var/coreseek-4.1-beta/testpack/etc/csft.conf
  31. Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
  32. Copyright (c) 2007-2011,
  33. Beijing Choice Software Technologies Inc (http://www.coreseek.com)

  34. using config file '/var/coreseek-4.1-beta/testpack/etc/csft.conf'...
  35. index 'xml': query '': returned 3 matches of 3 total in 0.000 sec

  36. displaying matches:
  37. 1. document=1, weight=1, published=Thu Apr  1 22:20:07 2010, author_id=1
  38. 2. document=2, weight=1, published=Thu Apr  1 23:25:48 2010, author_id=1
  39. 3. document=3, weight=1, published=Thu Apr  1 12:01:00 2010, author_id=2

  40. words:

  41. root:/var/coreseek-4.1-beta/csft-4.1#
复制代码
12、查看有关键词,正常搜索时的提示信息
  1. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/search -c /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf 关键词搜索测试
  2. Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
  3. Copyright (c) 2007-2011,
  4. Beijing Choice Software Technologies Inc ([url]http://www.coreseek.com[/url])

  5. using config file '/var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf'...
  6. index 'mysql': query '关键词搜索测试 ': returned 0 matches of 0 total in 0.000 sec

  7. words:
  8. 1. '关键词': 0 documents, 0 hits
  9. 2. '搜索': 2 documents, 5 hits
  10. 3. '测试': 2 documents, 2 hits

  11. root@npt-Aspire-4920:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/search -c /var/coreseek-4.1-beta/testpack/etc/csft.conf 关键词搜索测试
  12. Coreseek Fulltext 4.1 [ Sphinx 2.0.2-dev (r2922)]
  13. Copyright (c) 2007-2011,
  14. Beijing Choice Software Technologies Inc ([url]http://www.coreseek.com[/url])

  15. using config file '/var/coreseek-4.1-beta/testpack/etc/csft.conf'...
  16. index 'xml': query '关键词搜索测试 ': returned 0 matches of 0 total in 0.000 sec

  17. words:
  18. 1. '关键词': 0 documents, 0 hits
  19. 2. '搜索': 2 documents, 5 hits
  20. 3. '测试': 2 documents, 2 hits

  21. root:/var/coreseek-4.1-beta/csft-4.1#
复制代码
13、准备 PHP 动态网站 Coreseek 相关测试文件
  1. root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/etc/csft_mysql.conf  /usr/local/coreseek/etc/csft_mysql.conf    #拷贝 MySQL 配置文件
  2. root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/etc/csft.conf  /usr/local/coreseek/etc/csft.conf    #拷贝 XML 配置文件
  3. root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/api/sphinxapi.php  /usr/share/nginx/html/sphinxapi.php
  4. root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/api/test.php   /usr/share/nginx/html/test.php    #也可采用以下自定义 test.php 文件
  5. root:/var/coreseek-4.1-beta/csft-4.1# cp /var/coreseek-4.1-beta/testpack/api/test_coreseek.php  /usr/share/nginx/html/test_coreseek.php
  6. root:/var/coreseek-4.1-beta/csft-4.1#
复制代码

自定义新建  /usr/share/nginx/html/test.php 文件;

  1. vi  /usr/share/nginx/html/test.php
复制代码

/usr/share/nginx/html/test.php 自定义文件内容如下:

  1. <?php

  2. //注意文件的编码格式需要保存为为UTF-8格式

  3. require ( "sphinxapi.php" );

  4. $cl = new SphinxClient ();

  5. $cl->SetServer ( '127.0.0.1', 9312);

  6. //以下设置用于返回数组形式的结果

  7. $cl->SetArrayResult ( true );

  8. /*

  9. //ID的过滤

  10. $cl->SetIDRange(3,4);

  11. //sql_attr_uint等类型的属性字段,需要使用setFilter过滤,类似SQL的WHERE group_id=2

  12. $cl->setFilter('group_id',array(2));

  13. //sql_attr_uint等类型的属性字段,也可以设置过滤范围,类似SQL的WHERE group_id2>=6 AND group_id2<=8

  14. $cl->SetFilterRange('group_id2',6,8);

  15. */

  16. //取从头开始的前20条数据,0,20类似SQl语句的LIMIT 0,20

  17. $cl->SetLimits(0,20);

  18. //在做索引时,没有进行 sql_attr_类型 设置的字段,可以作为“搜索字符串”,进行全文搜索

  19. $res = $cl->Query ( '搜索字符串', "*" );    //"*"表示在所有索引里面同时搜索,"索引名称(例如test或者test,test2)"则表示搜索指定的

  20. //如果需要搜索指定全文字段的内容,可以使用扩展匹配模式:

  21. //$cl->SetMatchMode(SPH_MATCH_EXTENDED);

  22. //$res=cl->Query( '@title (测试)' , "*");

  23. //$res=cl->Query( '@title (测试) @content ('网络')' , "*");

  24. echo '<pre>';

  25. print_r($res['matches']);

  26. print_r($res);

  27. print_r($cl->GetLastError());

  28. print_r($cl->GetLastWarning());

  29. echo '</pre>';

  30. ?>
复制代码
14、管理 Coreseek 服务及进程
  1. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --all  #建立 MySQL 索引服务
  2. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --all  #建立 XML 索引服务
  3. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --all --rotate  #更新 MySQL 索引服务
  4. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --all --rotate  #更新 XML 索引服务
  5. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf --console  #启动 MySQL 测试模式
  6. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf --console  #启动 XML 测试模式
  7. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --rotate  #重建 MySQL 所有索引
  8. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft.conf --rotate  #重建 XML 所有索引
  9. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf  #开启 MySQL 搜索服务
  10. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf  #开启 XML 搜索服务
  11. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf --stop  #停止 MySQL 搜索服务
  12. root:/var/coreseek-4.1-beta/csft-4.1# /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft.conf --stop  #停止 XML 搜索服务
复制代码

查看进程:ps aux|grep searchd

杀死进程:killall searchd


15、测试 PHP 文件

FireFoxIE 浏览器中键入 http://localhost/test.phphttp://127.0.0.1/test.php (或  http://服务器 IP 地址/test.php 或  http://网站域名/test.php),返回内容如下:

自定义 /usr/share/nginx/html/test.php 返回内容如下:

FireFoxIE 浏览器中键入 http://localhost/test_coreseek.phphttp://127.0.0.1/test_coreseek.php (或  http://服务器 IP 地址/test_coreseek.php 或  http://网站域名/test_coreseek.php),返回内容如下:

16、设置开机后 Coreseek 后台自动运行,及定时任务

设置开机自动开启 MySQL 搜索服务

  1. vi /etc/init.d/rc.local
复制代码
  1. #!/bin/sh -e
  2. #
  3. # rc.local
  4. #
  5. # This script is executed at the end of each multiuser runlevel.
  6. # Make sure that the script will "exit 0" on success or any other
  7. # value on error.
  8. #
  9. # In order to enable or disable this script just change the execution
  10. # bits.
  11. #
  12. # By default this script does nothing.

  13. exit 0
  14. /usr/local/coreseek/bin/searchd -c /usr/local/coreseek/etc/csft_mysql.conf    #添加这行开机自动开启 MySQL 搜索服务
复制代码

设置定时任务

1、新建 /usr/local/coreseek/bin/build_index.sh 文件;

  1. vi /usr/local/coreseek/bin/build_index.sh
复制代码

/usr/local/coreseek/bin/build_index.sh 文件内容如下:

  1. #!/bin/sh

  2. /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --all --rotate    #增量更新索引
复制代码

2、修改定时任务设置文件

  1. vi /etc/crontab
复制代码

  /etc/crontab 文件修改后内容如下:

  1. # /etc/crontab: system-wide crontab
  2. # Unlike any other crontab you don't have to run the `crontab'
  3. # command to install the new version when you edit this file
  4. # and files in /etc/cron.d. These files also have username fields,
  5. # that none of the other crontabs do.

  6. SHELL=/bin/sh
  7. PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin

  8. # m h dom mon dow user    command
  9. 17 *    * * *    root    cd / && run-parts --report /etc/cron.hourly
  10. 25 6    * * *    root    test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.daily )
  11. 47 6    * * 7    root    test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.weekly )
  12. 52 6    1 * *    root    test -x /usr/sbin/anacron || ( cd / && run-parts --report /etc/cron.monthly )
  13. */30 * * * * root /usr/local/coreseek/bin/build_index.sh    #每 30 分钟增量更新索引一次
  14. 30 3 * * * root /usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/csft_mysql.conf --rotate    #每天 3 点 30 分重建索引一次
  15. #
复制代码
  1. service cron restart|reload    #重启或重载 crontab 服务
复制代码

版权声明:

本文为独家原创稿件,版权归 德云社区,未经许可不得转载;否则,将追究其法律责任。

广州市德数机械设备有限公司 ── 专业研发、设计、生产贴标机/不干胶贴标机/包装机/包装生产线/定制非标设备
回复

使用道具 举报

189

主题

299

帖子

1211

积分

版主

Rank: 7Rank: 7Rank: 7

金钱
687
金币
13
威望
0
贡献
0
 楼主| 发表于 2015-1-3 03:08:11 | 显示全部楼层
回复 支持 反对

使用道具 举报

189

主题

299

帖子

1211

积分

版主

Rank: 7Rank: 7Rank: 7

金钱
687
金币
13
威望
0
贡献
0
 楼主| 发表于 2015-1-3 03:08:29 | 显示全部楼层
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|Sitemap|手机版|小黑屋|德云社区    

GMT+8, 2017-11-23 02:26 , Processed in 0.073436 second(s), 19 queries , Apc On.

版权所有 © Guangzhou Digits Cloud Technology Co., Ltd.

工业和信息化部:粤ICP备14079481号-2

快速回复 返回顶部 返回列表