用户名: 密码:
会员中心 在线投稿
| 网站首页 | 中国历史 | 世界历史 | 历史名人 | 教案试题 | 历史故事 | 考古发现 | 历史图片 | 文化 |
相关文章    
您现在的位置: 历史千年 >> 文化 >> 国学文化 >> 正文
四川大学校长谢和平在2…
清华大学校长顾秉林在2…
杨玉良在复旦大学2011届…
张杰在上海交通大学201…
周其凤在北京大学2011年…
毕业论文先“验抄”再答…
香港中大革新中文课 医…
试论管理科学期刊影响因…
浅谈地理科学在广告产业…
感染管理科甲型H1N1流感…
最新热门    
 
理科生解码《全宋词》 宋词粉丝感到“偶像破灭”

时间:2011-12-2 10:34:52  来源:不详
你还在羡慕那些出口成章的大词人?你还在苦苦思索优美诗词的灵感?从今以后,这些烦恼可以去无踪了! 
  昨日,有网友将《全宋词》文本变成编程“数据”,制作各类诗词。
  此举也引发大家竞相效仿,用各种号码随意“创作”起宋词来!这也让不少网友惊呼:人类已经无法阻止理科生了!
  理科生的“频率分析”《全宋词》文本成编程“数据” 
  这位名为“yixuan”的网友在个人博客“怡然轩”里,一篇名为《东风何处是人间》的博文中写道:“再次神经短路,突然想看看宋词里面,什么样的意象是最常见的,比如可以做个频率分析什么的。当然文本挖掘需要时间,我没法在其中花太多时间,于是想出了一个土办法。宋词的句子都很短,如果穷举可能的字的组合的话并不是太多,况且最常见的词语一般是两三个字,这样可能的组合就更少了。比如“犹解嫁东风”这句话,可能的二字组合是“犹解”“解嫁”“嫁东”“东风”,三字组合是“犹解嫁”“解嫁东”“嫁东风”,词的字数越多,可能的组合就越少。如果把每句话可能的字的组合都列举出来,就可以整体统计频率了。”
  该网友还真的一本正经地做起数据分析来,并一一列举,写明:“数据:《全宋词》文本”,代码则用计算机语言列出,十足的理科生做派。如果没有一定的编程知识,要看懂会比较费劲!在“yixuan”贴出的高频词中,可以看到,排在前面的分别是:1、14852、东风(1382)3、何处(1230)4、人间(1202)5、风流(857)6、归去(812)7、春风(802)8、西风(779)9、归来(771)10、江南(765)……至于为什么第一的是数字,他解释:“排在第一的是无效字符,这跟数据源有关。”该分析也被网友纷纷称赞,网友Kuya19说:“非常有意思,这些大概就是中华文化的文字密码了。人间、江南、相思、梅花、千里、回首、明月、黄昏……希望您能把全唐诗也做一次同样的解析!”
  网络大神破密码:圆周率其实是首宋词!
  记者注意到,yixuan发表该博文的时间是今年3月2日。而昨日在科学小清新比较喜欢的科普网站果壳网上转载后,再次引发“连锁效应”。其中尤以网友“达芬奇[注: 达芬奇(意大利文:Leonardo da Vinci,1452年4月15日-1519年5月2日),又译达文西,全名列奥纳多·迪·瑟皮耶罗·达芬奇(Leonardo di ser Piero da Vi]的鸡蛋”的反应最为“给力”,他将圆周率的数字,与“宋词”的高频词表序号一一对照,“创作”出一首《清平乐·圆周率》!还将之一一注明,“回首明月(一看就是抒情诗),悠悠心事空(果然,貌似失恋了),西湖何事寂寞中(触景生情),风吹斜阳匆匆(回忆那天下午的艳遇),芳草平生斜阳(平生见过最美的太阳和芳草,都是因为那里有你的身影),风吹寂寞今日(到现在就剩我自己),一枝富贵年年(好花美丽年年开,好景宜人不常在[注: 常在,清宫女称号,与“答应”同为最低级妃嫔。《清史稿?后妃列传》:“皇后居中宫;皇贵妃一、贵妃二、妃四、嫔六、贵人、常在、答应无定数,分居东西十二宫。]),断肠长安[注: 长安 长安,意为“长治久安”,现今西安城的旧称,是我国七大古都之首。与开罗、雅典、罗马并称“世界四大古都”。从公元前11世纪到公元10世纪左右,]不知(我的思念远方的你可知道)?
  其他网友

[1] [2] [3] 下一页

 
  | 设为首页 | 加入收藏 | 联系我们 | 友情链接 | 版权申明 |  
Copyright 2006-2011 © www.lsqn.cn   All rights reserved
历史千年 版权所有