Begin
上次用C#把《全唐诗》和《唐诗三百首》整理成为QData格式之后,就开始进行各种分析…
详细内容可以看看上次这篇文章,《用C#来学习唐诗三百首和全唐诗》
接下来讲一下分析的内容,由于笔者不是很懂文学和大数据统计什么的,所以只好随便分析一通,首先分析的有:标题、作者、单字分析、还有诗句字数(也就是“五言”、“七言”)
标题分析
标题分析就是分析有多少首诗采用了某一个标题啦~
首先是《唐诗三百首》
从统计可以看到《子夜四时歌》出现的次数是最多的= =.. 虽然不懂是什么,但觉得蛮厉害的
接下来看看《全唐诗》的分析结果
哇,这下可就厉害了,我的《全唐诗》数据文件中共有42904首诗,虽然不全,不足以称之为“全”唐诗,但是也胜在基数之大。
从分析结果看到,排名第一的标题是《句》,共有437首诗采用这个标题,看起来就很非主流的一个标题居然深受唐朝文人骚客的喜爱;排名第二的是《古意》,不过这个和第一名的差距可就大了,总共只有39首,可不知道这个”古意“是怀古之意还是古人之意。
作者分析
作者分析就是统计每个诗人总共写了多少首诗,以及总字数。
先来看看《唐诗三百首》的结果
嗯,不错,杜甫摘取桂冠。不过《三百首》毕竟是小样本,真正的还得看大块头的。
延伸阅读
- ssh框架 2016-09-30
- 阿里移动安全 [无线安全]玩转无线电——不安全的蓝牙锁 2017-07-26
- 消息队列NetMQ 原理分析4-Socket、Session、Option和Pipe 2024-03-26
- Selective Search for Object Recognition 论文笔记【图片目标分割】 2017-07-26
- 词向量-LRWE模型-更好地识别反义词同义词 2017-07-26
- 从栈不平衡问题 理解 calling convention 2017-07-26
- php imagemagick 处理 图片剪切、压缩、合并、插入文本、背景色透明 2017-07-26
- Swift实现JSON转Model - HandyJSON使用讲解 2017-07-26
- 阿里移动安全 Android端恶意锁屏勒索应用分析 2017-07-26
- 集合结合数据结构来看看(二) 2017-07-26
学习是年轻人改变自己的最好方式