Begin

上次用C#把《全唐诗》和《唐诗三百首》整理成为QData格式之后,就开始进行各种分析…

详细内容可以看看上次这篇文章,《用C#来学习唐诗三百首和全唐诗》

接下来讲一下分析的内容,由于笔者不是很懂文学和大数据统计什么的,所以只好随便分析一通,首先分析的有:标题、作者、单字分析、还有诗句字数(也就是“五言”、“七言”)

标题分析

标题分析就是分析有多少首诗采用了某一个标题啦~

首先是《唐诗三百首》

seo优化培训,网络推广培训,网络营销培训,SEM培训,网络优化,在线营销培训

从统计可以看到《子夜四时歌》出现的次数是最多的= =.. 虽然不懂是什么,但觉得蛮厉害的

接下来看看《全唐诗》的分析结果

seo优化培训,网络推广培训,网络营销培训,SEM培训,网络优化,在线营销培训

哇,这下可就厉害了,我的《全唐诗》数据文件中共有42904首诗,虽然不全,不足以称之为“全”唐诗,但是也胜在基数之大。

从分析结果看到,排名第一的标题是《句》,共有437首诗采用这个标题,看起来就很非主流的一个标题居然深受唐朝文人骚客的喜爱;排名第二的是《古意》,不过这个和第一名的差距可就大了,总共只有39首,可不知道这个”古意“是怀古之意还是古人之意。

作者分析

作者分析就是统计每个诗人总共写了多少首诗,以及总字数。

先来看看《唐诗三百首》的结果

seo优化培训,网络推广培训,网络营销培训,SEM培训,网络优化,在线营销培训

嗯,不错,杜甫摘取桂冠。不过《三百首》毕竟是小样本,真正的还得看大块头的。

seo优化培训,网络推广培训,网络营销培训,SEM培训,网络优化,在线营销培训

延伸阅读

学习是年轻人改变自己的最好方式-Java培训,做最负责任的教育,学习改变命运,软件学习,再就业,大学生如何就业,帮大学生找到好工作,lphotoshop培训,电脑培训,电脑维修培训,移动软件开发培训,网站设计培训,网站建设培训学习是年轻人改变自己的最好方式