关键字:诗词 统计
Keywords: poetry statistics
摘 要: 通过统计中国诗词大会的诗词出现频次,发现哪个朝代、作者、诗词最受欢迎。
英文摘要: Based on the statistics of the frequency of poetry in the Chinese poetry conference, we can find out which dynasty, author and poetry are the most popular.
本文为作者呕心沥血所做,为原创作品,任何转载都必须经过我的书面同意,否则视为侵权。
我不太喜欢上来就说很严肃的话,但是,以防万一么,嘿嘿。
“生活不止眼前的苟且,还有诗和远方”,这是2017年一句非常火的话,我也很赞同!《中国诗词大会》更是一档以诗词为中心内容的节目,今天,我就要为大家展示我收集到的数据,来为大家展示哪些朝代和诗人的诗最为广泛,写的诗最经典;那些朝代的“经典诗人”最多。
在节目里众多涉及到的诗词中,我希望通过两集节目获得的数据和经过数据统计,来解决如下疑问:
哪个朝代的诗词最为广泛?
究竟哪位诗人写的古诗最为经典(以毛泽东的古诗为现代诗和古诗的界限)?
哪一首诗最为广泛?
哪一句诗最为广泛?
有问题就要有解决的方案,我的解决方案如下:
有问题,有解决问题的方案,在行动之前,还是要把自己的猜想写出来,我的猜想如下:
万事俱备,可以开始行动了,我的分析如下: 本人随机选取了2017年2月6日和2017年2月16日两期节目所涉及的古诗词进行统计,分析,分别采集到诗词数、作者及朝代数见下表:
5.1 表一 采集数据统计表
节目期 | 诗词总数 | 诗词总数 | 朝代 |
---|---|---|---|
20170206 | 90 | 37 | 7 |
20170216 | 71 | 43 | 15 |
现在先就2017年2月6日的数据进行分析,选择出前3名的诗词、作者和朝代。列表如下:(但是应为诗名诗句都只有3个及以下的数据,所以暂定不能分出高下,在稍后的两集合在一起时,会再次测量。在下表,就会把诗名的前2名的数据、诗句的前1名的数据都展示出来)
5.2 表2 2017.2.6诗词统计表
序号 | 诗句 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 黄河远上白云间,一片孤城万仞山 | 2 | 2.22% |
2 | 桃花潭水深千尺,不及汪伦送我情 | 2 | 2.22% |
5.3 表3 2017.2.6诗名统计表
序号 | 诗名 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 望洞庭湖赠张丞相 | 3 | 3.33% |
2 | 凉州词二首·其一 | 2 | 2.22% |
3 | 梦游天姥吟留别 | 2 | 2.22% |
4 | 秋词 | 2 | 2.22% |
5 | 十六字令三首 | 2 | 2.22% |
6 | 水调歌头·明月几时有 | 2 | 2.22% |
7 | 送友人 | 2 | 2.22% |
8 | 早春呈水部张十八员外 | 2 | 2.22% |
9 | 赠汪伦 | 2 | 2.22% |
5.4 表4 2017.2.6作者统计表
序号 | 作者 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 李白 | 15 | 16.67% |
2 | 苏轼 | 12 | 12% |
3 | 杜甫 | 5 | 5% |
4 | 毛泽东 | 5 | 5% |
5 | 王维 | 5 | 5% |
5.5 表5 2017.2.6朝代统计表
序号 | 朝代 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 唐 | 57 | 63.33% |
2 | 宋 | 21 | 23.33% |
3 | 现代 | 5 | 5.56% |
从上表,我们就此可以暂定为李白的诗在诗词大会出现的最多,而李白所在的时代,唐朝,在诗词大会里出现的最多。诗句最多的是“黄河远上白云间”,“一片孤城万仞山”和“桃花潭水深千尺,不及汪伦送我情”; 一首诗的重复出现量最多的是:《望洞庭湖赠张丞相》。所以,在2017.2.6这一集当中,我的四条猜想有两条正确,两条不正确,正确率为50%。
现在就2017年2月16日的数据进行分析,选择出前3名的诗词、作者和朝代。列表如下:(但是应为诗名诗句都只有3个及以下的数据,所以暂定不能分出高下,在稍后的两集合在一起时,会再次测量。在下表,就会把诗名、诗句的前1名的数据都展示出来)
5.6 表6 2017.2.16诗名统计表
序号 | 诗名 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 送杜少府之任蜀州 | 2 | 2.82% |
2 | 白雪歌送武判官归京 | 2 | 2.82% |
3 | 卜算子·咏梅 | 2 | 2.82% |
4 | 将进酒·君不见 | 2 | 2.82% |
5 | 桃花庵歌 | 2 | 2.82% |
6 | 题都城南庄 | 2 | 2.82% |
7 | 虞美人·春花秋月何时了 | 2 | 2.82% |
8 | 葬花词 | 2 | 2.82% |
5.7 表7 2017.2.16诗句统计表
序号 | 诗句 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 海内存知己,天涯若比邻。 | 2 | 2.82% |
2 | 忽如一夜春风来,千树万树梨花开。 | 2 | 2.82% |
3 | 莫道不销魂,帘卷西风,人比黄花瘦。 | 2 | 2.82% |
4 | 去年今日此门中,人面桃花相映红。 | 2 | 2.82% |
5 | 桃花仙人种桃树,又摘桃花换酒钱。 | 2 | 2.82% |
6 | 天生我材必有用,千金散尽还复来。 | 2 | 2.82% |
5.8 图8 2017.2.16作者统计表
序号 | 作者 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 李白 | 7 | 9.86% |
2 | 杜甫 | 4 | 5.63% |
3 | 杜牧 | 3 | 4.23% |
4 | 王维 | 3 | 4.23% |
5.9 图9 2017.2.16朝代统计表
序号 | 朝代 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 唐 | 43 | 60.56% |
2 | 宋 | 11 | 15.49% |
3 | 清 | 3 | 4.23% |
从上表我们可以看出,在中国诗词大会里,唐朝和李白稳稳的还排在第一,而“天生我材必有用”和《将进酒·君不见》也为第一,所以在2017.2.16这集当中,猜想有4条,也就是全部正确,正确率为100%。
现在分别就两集的汇总数据进行分析,选择出前3名的诗词、作者和朝代。列表如下:(但是应为诗名诗句都只有3个及以下的数据,所以暂定不能分出高下,在稍后的两集合在一起时,会再次测量。在下表,就会把诗名的前2名和诗句的前1名展示出来)
5.10 图10 汇总诗名统计表
序号 | 诗名 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 白雪歌送武判官归京 | 3 | 1.86% |
2 | 卜算子·咏梅 | 3 | 1.86% |
3 | 望洞庭湖赠张丞相 | 3 | 1.86% |
4 | 虞美人·春花秋月何时了 | 3 | 1.86% |
5 | 送杜少府之任蜀州 | 2 | 1.24% |
6 | 将进酒·君不见 | 2 | 1.24% |
7 | 九月九日忆山东兄弟 | 2 | 1.24% |
8 | 离思五首·其四 | 2 | 1.24% |
9 | 凉州词二首·其一 | 2 | 1.24% |
10 | 梦游天姥吟留别 | 2 | 1.24% |
11 | 念奴娇·赤壁怀古 | 2 | 1.24% |
12 | 秋词 | 2 | 1.24% |
13 | 山行 | 2 | 1.24% |
14 | 十六字令三首 | 2 | 1.24% |
15 | 水调歌头·明月几时有 | 2 | 1.24% |
16 | 送友人 | 2 | 1.24% |
17 | 桃花庵歌 | 2 | 1.24% |
18 | 题都城南庄 | 2 | 1.24% |
19 | 闻王昌龄左迁龙标遥有此寄 | 2 | 1.24% |
20 | 乌衣巷 | 2 | 1.24% |
21 | 寻隐者不遇 | 2 | 1.24% |
22 | 忆江南 | 2 | 1.24% |
23 | 饮酒(其五) | 2 | 1.24% |
24 | 葬花词 | 2 | 1.24% |
25 | 早春呈水部张十八员外 | 2 | 1.24% |
26 | 赠汪伦 | 2 | 1.24% |
27 | 竹石 | 2 | 1.24% |
28 | 醉花阴·薄雾浓云愁永昼 | 2 | 1.24% |
5.11 图11 汇总诗人统计表
序号 | 作者 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 李白 | 22 | 13.66% |
2 | 苏轼 | 14 | 8.7% |
3 | 杜甫 | 9 | 5.59% |
5.12 图12 汇总朝代统计表
序号 | 朝代 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 唐 | 100 | 62.11% |
2 | 宋 | 32 | 19.88% |
3 | 清 | 6 | 3.73% |
4 | 现代 | 6 | 3.73% |
5.14 图13 汇总诗句统计表
序号 | 诗句 | 数量 | 占总数的百分比 |
---|---|---|---|
1 | 海内存知己,天涯若比邻 | 3 | 1.86% |
2 | 莫道不销魂,帘卷西风,人比黄花瘦。 | 3 | 1.86% |
3 | 曾经沧海难为水,除却巫山不是云。 | 2 | 1.24% |
4 | 忽如一夜春风来,千树万树梨花开。 | 2 | 1.24% |
5 | 黄河远上白云间,一片孤城万仞山。 | 2 | 1.24% |
6 | 千磨万击还坚劲,任尔东西南北风。 | 2 | 1.24% |
7 | 去年今日此门中,人面桃花相映红。 | 2 | 1.24% |
8 | 桃花潭水深千尺,不及汪伦送我情。 | 2 | 1.24% |
9 | 桃花仙人种桃树,又摘桃花换酒钱。 | 2 | 1.24% |
10 | 天生我材必有用,千金散尽还复来 | 2 | 1.24% |
11 | 遥知兄弟登高处,遍插茱萸少一人。 | 2 | 1.24% |
12 | 朱雀桥边野草花,乌衣巷口夕阳斜。 | 2 | 1.24% |
从上表可以看出,《白雪歌送武判官归京》《卜算子·咏梅》《望洞庭湖赠张丞相》《虞美人·春花秋月何时了》这集首诗最为受欢迎,李白和李白所在的朝代——唐朝都稳稳的是第一,“海内存知己,天涯若比邻。”和“莫道不销魂,帘卷西风,人比黄花瘦。”是古诗词的第一名。最后经过核算,我答对两道,答错两道,正确率为50%。
1.先从我的猜想和现实进行比对3次2种不同的数据,从而发现,若每个都占,那么合算,我答对的正确率为83.3333333333(计算过程:100%+50%*2=200%,200%/3=66.67%)
2.从以上数据我们发现,在大部分时候,李白的诗至少在诗词大会这两集里常见的,而唐朝的诗又是在朝代里最常见的了。
最后祝大家能在诗词中享受快乐!也经过这次的论文,让我对“生活不止眼前的苟且,还有诗和远方”这句话有了新的理解,可以改为“生活不止眼前的苟且,还有诗和远方,更需要实际去统计、去分析”,虽然我这次的猜想和我统计的有偏差,但是结果比猜测更重要。最后我要说明一下我的数据有两个要点,以防万一:
1.本文虽然收集了161首古诗,但是仅从中国诗词大会的2集进行统计,不适用于其它的节目。
2.本文也不用于其他商业用途,感谢在百度的搜索功能让我们能快速获取资料,也感谢中国诗词大会播出的诗词让我们有了可以统计的资料。
本文作者:Owenzjg
本文链接:
版权声明:非作者书面同意禁止转载