[发明专利]一种嵌名春联的计算机生成方法有效
申请号: | 201310249714.1 | 申请日: | 2013-06-21 |
公开(公告)号: | CN103336803A | 公开(公告)日: | 2013-10-02 |
发明(设计)人: | 潘志庚;郭晶;蒋锐滢;张世程 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 杜军 |
地址: | 310036 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 春联 计算机 生成 方法 | ||
技术领域
本发明属于计算机自然语言处理技术领域,尤其涉及一种嵌名春联的计算机生成方法,具体涉及隐马尔科夫模型和具有特殊限定字的二元词图解码方法。
背景技术
传统的计算机对联生成系统,有利用隐马尔科夫模型和概率语言模型的,有应用神经网络的方法,也有应用统计机器翻译模型的,还有基于最大匹配分词与最大熵马尔科夫模型的 。过往对对联生成的研究工作,仍旧存在着可提高的地方:
1)过往的对联生成研究则只侧重于下联自动应对,即必须给出了上联,之后用不同方法进行下联的应对,而现实生活中人们会按照某些特殊的需求来定制一副对联。
2)已有工作大多都是针对对联这个大概念展开的,其中的规则和内容的约束没有特别严格,在对联文化中最具有代表性的当属春联,对春联的研究也是普通宽泛的通用春联研究,本发明提出嵌名春联的计算机生成。
3)本发明的难点在于内容具有针对性,即特定春节语境;语义要有正面积极意义,语义评价至关重要;特定字的加入,缩小了数据可选择范围,提高了生成难度。
发明内容
本发明的目的是克服现有技术的不足,提供一种嵌名春联的计算机生成方法。
本发明解决其技术问题所采用的技术方法如下:
步骤(1)收集现有的春联,集成一个原始语料库;
步骤(2)对所收集的春联进行词切分,建立词库,并构建熟语料库。具体如下:
2-1通过应用基于统计的抽词方法与前后向最大匹配方法的结合,对原始语料库进行分词,并应用朴素贝叶斯算法辅助消歧;然后对切分所得的所有数据进行训练标注,简言之,词库的切分遵循七言诗句以2-2-2-1或2-2-1-2的形式,五言诗句多以2-2-1或2-1-2的形式切分,得到词库。计算词库中的每个词 和每个词的词频,然后计算每个词出现的概率。
其中,c为词库中的总词数。
2-2对词库进行模型训练,统计词库中任意两个词语在同一联句中作为前后搭配共现的概率,以及在同一春联的上下联相同位置共现的概率,并做归一化处理;
所述的模型训练是指首先用词库中每个的词去原始联句库中搜索同一联句中其后面搭配的词,并统计两词共现的频次,然后计算两个前后搭配共现的概率:
其中,n为共现词的组数,也就是说词库中共有n组前后共现词。
同一幅对联中上下两联相同位置词语共现的概率计算方法同步骤2-2上,此时的n表示词库中经统计有同一幅对联中上下联相同位置的共现词有n组。而则表示的是同一幅对联中上下联相同位置的一组共现词的词频。
对所求得的概率表进行归一化处理,将概率表中概率小于阈值T的概率,修改为数值。归一化处理是为了防止因概率过小造成的数据稀疏。
2-3对所得春联分词词库进行词性标注;
2-4构造平仄库,也称声韵库,用以在自动生成过程中判断生成内容的平仄对应。以现在的读音标准为依据,声韵库主要是以《诗韵新编》为标准进行整理,如“春天”,其词性为名词N,注音为春天,对应的韵脚为十七庚,属平声。
2-5通过以上步骤建立包括词、词性、音韵的格律诗对联熟语料库。
步骤(3)运用词语扩展技术型分别生成多条字数相同的、具有特殊嵌定字的上联和下联;具体如下:
3-1应用词语扩展技术对嵌定字进行左右扩展;
根据给定的关键字,在词库中搜素包含这个关键字的词语,然后根据步骤2-2中得到的概率表进行词语的左右扩展。
3-2因为春联中的主题元素是生肖年,所以在联句生成的最后三个字在特定的主题元素库中进行匹配,匹配遵循平仄韵律规则、词性对仗规则。
所述的特定的主题元素库指生肖年库。
本发明有益效果:
1)在对联的计算机研究工作中提出针对特定语境(春联)的研究方法;
2)在特定语境联句的生成中又加入特定关键字(嵌名字)生成个性化嵌名春联;
3)增强了计算机春联生成的趣味性,真正实现了个性化、具体化;
附图说明
图1是本发明词语扩展技术举例;
图2是本发明嵌字约束下的下联解码过程;
图3是本发明熟语料库图。
具体实施方式
下面结合附图对本发明做进一步说明。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310249714.1/2.html,转载请声明来源钻瓜专利网。