[发明专利]用于提取新复合词的系统和方法无效
| 申请号: | 200710088125.4 | 申请日: | 2007-03-15 |
| 公开(公告)号: | CN101093504A | 公开(公告)日: | 2007-12-26 |
| 发明(设计)人: | 村上明子;渡边日出雄 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
| 代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 李德山 |
| 地址: | 美国*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 提取 复合词 系统 方法 | ||
技术领域
本发明涉及用于从多个文本中提取短语的系统。具体而言,本发明涉及基于短语出现频率提取短语的系统
背景技术
顾客可以将他们关于公司及其货物和服务的批评、抱怨等张贴到在Internet上的公告牌和网络日志(weblog)上。与例如在呼叫中心收集信息或收集对问卷的应答信息的传统情形相比,这样的信息量更大,且很容易收集。此外,顾客往往将坦诚的意见张贴到公告牌和网络日志上。如果使用这样的信息,公司将进一步提升公司策略的规划。
顾客可以以任何样式向公告牌和网络日子张贴文本。用于从这样各种样式的文本中提取有用信息的技术称为“文本挖掘(text mining)”等,已对该技术进行了研究(参看非专利文献4至6和专利文献2至5)。在文本挖掘中,通常对所要关注的关键词在文本中出现的频率以及频率随时间的变化进行分析。在该文本中的关键词不仅可以为单个单词,还可为由多个单词组合而成的复合词。然而,要适当确定出要关注的关键词却并非容易,该确定可导致文本挖掘结果大相径庭。
[专利文献1]日本专利申请公开No.2002-245062
[专利文献2]日本专利申请公开No.2001-325272
[专利文献3]日本专利申请公开No.2004-206391
[专利文献4]日本专利申请公开No.2002-251402
[专利文献5]日本专利申请公开No.2005-165748
[非专利文献1]S.Ananiadou 1994.A Methodology For AutomaticTerm Recognition.CLOING 1994:1034-1038
[非专利文献2]Nakagawa H.And Mori T.2003 Automatic TermRecognition based on Statistics of Compound Nouns and theirComponents.Terminology,Vol.9 No.2,pp.201-219
[非专利文献3]Nakagawa Hiroshi.and Mori Tatsunori,YumotoHiroaki.2003.SYUTUGEN-HIND TO RENSETU-HINDO NIMOTODUKU SENMON-YOUGO CHUUSHUTSU SIZEN-GENGO-SYORI(Terminology Extraction and Natural Language Processing basedon Appearing Frequency and Linking Frequency),Vol.10 No.1,pp.27-45
[非专利文献4]J.Kleinberg 2002 Bursty and HierarchicalStructure in Streams.KDD 2002,pp.91-101
[非专利文献5]Sato Yoshihide.,Kawashima Harumi,SasakiTsutomu.,and Oku Masahiro.2005 ZIKEIRETSU NYUSU NI OKERUSAISHIN-WADAIGO-CHUUSHUTSU-HOUHOU(Method forExtracting Terms of Current Information of Temporal News.)Information Processing Society of Japan.Special Interest Group ofNatural Language Processing.NL168,pp.1-12
[非专利文献6]Sekiguchi Yuuichiro,Sato Yoshihide,KawashimaHarumi,Okuda Hidenori and Oku Masahiro 2005 BLOG-PEZI-SYUUGOU NI TAISURU WADAIGoKU CHUUSHUTSU SYUHOU(Method for Extracting Terms of Current Topics in Blog Page Assembly).Information processing Society of Japan,Special Interest Group ofNatural Language Processing NL170,pp27-32
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710088125.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:可加工的填充固化性卤化异烯烃弹性体
- 下一篇:磁性多层膜的制造方法





