码迷,mamicode.com
首页 > 其他好文 > 详细

xunsearch使用SCWS

时间:2018-07-02 19:26:49      阅读:259      评论:0      收藏:0      [点我收藏+]

标签:使用   分词   ops   print   arc   必须   sea   提取   href   

目录

在 Xunsearch 使用 SCWS

创建分词对象

$xs = new XS('my');  // 必须先创建一个 xs 实例,否则会抛出异常
$tokenizer = new XSTokenizerScws;   // 直接创建实例

获取分词结果

$xs = new XS('my');  // 必须先创建一个 xs 实例,否则会抛出异常
$tokenizer = new XSTokenizerScws();   // 直接创建实例
$text = '上海人民公园';
$words = $tokenizer->getResult($text);
print_r($words);
Array
(
    [0] => Array
        (
            [off] => 0
            [attr] => ns  
            [word] => 上海
        )

    [1] => Array
        (
            [off] => 6
            [attr] => n   
            [word] => 人民
        )

    [2] => Array
        (
            [off] => 12
            [attr] => n   
            [word] => 公园
        )

)

提取重要词汇

$xs = new XS('my');  // 必须先创建一个 xs 实例,否则会抛出异常
$tokenizer = new XSTokenizerScws();   // 直接创建实例
$text = '上海人民公园';
$tops = $tokenizer->getTops($text, 5, 'n,v,vn');
print_r($tops);

xunsearch使用SCWS

标签:使用   分词   ops   print   arc   必须   sea   提取   href   

原文地址:https://www.cnblogs.com/jiqing9006/p/9255225.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!