[发明专利]社群特有表现检测装置及方法无效
申请号: | 200680025802.1 | 申请日: | 2006-07-13 |
公开(公告)号: | CN101223521A | 公开(公告)日: | 2008-07-16 |
发明(设计)人: | 小田弘美 | 申请(专利权)人: | 惠普开发有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/28;G06F17/30 |
代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 张雪梅;刘宗杰 |
地址: | 美国德*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社群 特有 表现 检测 装置 方法 | ||
1.一种装置,其特征在于,
从规定的社群中使用的文本集合,检索所述规定的社群中的特有表现,具有以下从(a)到(d)的单元,
(a)抽出所述规定的社群中特有使用的n元语法搭配的单元,
(b)选择有可能成为所述特有表现的核的第一词干的单元,
(c)根据使用所述第一词干的显著性以及取入了所述第一词干的前或后的要素的第二词干的显著性计算出来的值,选择扩展词干的单元,
(d)从所述扩展词干中,根据该语言的语言形成规则,选择所述规定的社群中特有表现的单元。
2.根据权利要求1所述的装置,其特征在于,
进一步包含:
通过把规定的术语列表中包含的术语作为关键词进行数据检索,将所述文本集合进行收集的单元。
3.根据权利要求1或2所述的装置,其特征在于,
抽出所述n元语法搭配的单元包含:利用多个社群中使用的文本,并根据所述规定的社群中使用的n元语法搭配的显著性与其他社群中使用的n元语法搭配的显著性的比较,抽出所述n元语法搭配的单元。
4.根据权利要求1或2所述的装置,其特征在于,
选择所述扩展词干的单元还包含:
根据使用所述第二词干的数量以及作为在所述第二词干中取入的要素是区分要素的数量算出的值,选择所述扩展词干的单元。
5.根据权利要求1或2所述的装置,其特征在于,
根据所述语言形成规则选择的单元包含名词化规则、动词化规则、形容词化规则以及形容词动词化规则中的至少一个语言形成规则。
6.一种方法,其特征在于,
从规定的社群中使用的文本集合,检索所述规定的社群中的特有表现,具有以下从(a)到(d)的步骤,
(a)抽出所述规定的社群中特有使用的n元语法搭配的步骤,
(b)选择有可能成为所述特有表现的核的第一词干的步骤,
(c)根据使用所述第一词干的显著性以及取入了所述第一词干的前或后的要素的第二词干的显著性计算出来的值,选择扩展词干的步骤,
(d)从所述扩展词干中,根据该语言的语言形成规则,选择所述规定的社群中特有表现的步骤。
7.根据权利要求6所述的方法,其特征在于,
还包含:
通过把规定的术语列表中包含的术语作为关键词进行数据检索,将所述文本集合进行收集的步骤。
8.根据权利要求6或7所述的方法,其特征在于,
抽出所述n元语法搭配的步骤包含:利用多个社群中使用的文本,并根据所述规定的社群中使用的n元语法搭配的显著性与其他社群中使用的n元语法搭配的显著性的比较,抽出所述n元语法搭配的步骤。
9.一种程序,其特征在于,
从规定的社群中使用的文本集合,检索所述社群中的特有表现,并控制计算机使以下从(a)到(d)的单元进行工作,
(a)抽出所述社群中特有使用的n元语法搭配的单元,
(b)选择有可能成为所述特有表现的核的第一词干的单元,
(c)根据使用所述第一词干的显著性以及取入了所述第一词干的前或后的要素的第二词干的显著性计算出来的值,选择扩展词干的单元,
(d)从所述扩展词干中,根据该语言的语言形成规则,选择所述规定的社群中特有表现的单元。
10.根据权利要求9所述的程序,其特征在于,
还包含:
通过把规定的术语列表中包含的术语作为关键词进行数据检索,将所述文本集合进行收集的单元。
11.根据权利要求9或10所述的程序,其特征在于,
抽出所述n元语法搭配的单元包含:利用多个社群中使用的文本,并根据所述规定的社群中使用的n元语法搭配的显著性与其他社群中使用的n元语法搭配的显著性的比较,抽出所述n元语法搭配的单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普开发有限公司,未经惠普开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680025802.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:新型红色荧光材料及其制备方法
- 下一篇:放电灯点亮电路