當前位置:主頁 > 新聞 > 熱點新聞 >
互聯網彩票或開閘:兩會關注“保就業”,切中了關鍵問題

生化危機2重制版:4圖帶你盤點1978年到2019年政府工作報告關鍵詞

2019-06-03 04:43 來源:網絡整理 責任編輯:北京體育廣播小編

(原標題:數據說兩會|1978年到2019年政府工作報告關鍵詞盤點)

2019年3月5日上午,第十三屆全國人民代表大會第二次會議在北京人民大會堂開幕,國務院總理李克強作政府工作報告。澎湃新聞從中國政府網上,整理了中國政府網上1978年至2019年共計42份《政府工作報告》中的常青詞匯。結果顯示,“發展”、“建設”以及“經濟”等詞語在過去42年中一直高頻出現。

生化危機2重制版:4圖帶你盤點1978年到2019年政府工作報告關鍵詞

還有部分詞語愈發頻繁地出現在《政府工作報告》中。“創新”,1997年后開始被頻頻提起,因其增長趨勢,澎湃新聞將此類詞語稱為“喇叭形詞語”,類似的詞語還有“就業”、“創業”、“民生”、“脫貧”等。

值得注意的是,2019年的《政府工作報告》指出,今年將實施更大規模的減稅,還將明顯降低企業社保繳費負擔。從42年《政府工作報告》的關鍵詞趨勢來看,“減稅”、“壓減”、“社保”等詞語也能看出明顯的增長趨勢。

生化危機2重制版:4圖帶你盤點1978年到2019年政府工作報告關鍵詞

澎湃新聞還對比了幾組關鍵詞在這42年間的趨勢變化,“農業”與“工業”相比,在近四十年里被提及狀況相對穩定,但兩者被提及程度幾年來趨于一致。2000年以來,“制造業”與“服務業”幾乎同時開始被提及,但是“服務業”的被提及率幾乎都高于“制造業”。

生化危機2重制版:4圖帶你盤點1978年到2019年政府工作報告關鍵詞

有些詞雖然在《政府工作報告》里出現頻率相對較少,但是它們首次出現的時間點都反映了當年中國人關注的熱點問題。

生化危機2重制版:4圖帶你盤點1978年到2019年政府工作報告關鍵詞

分析方法:

1.本文所有原始文本材料來自中國政府網1978年至2019年政府工作報告。

2.本文使用jieba分詞(https://github.com/fxsjy/jieba/)。采用精確分詞模式,避免重復分詞和歧義。分詞結果均去掉數字、單字、標點符號。

3.為增加分詞正確率,在jieba分詞的基礎上加入自定義詞典,自定義詞典主要包含了往年人民網和新華網統計的兩會熱詞。

4.在分詞基礎上,采用TF-IDF加權技術。詞語的重要性隨著它在文本中出現的次數成正比增加,但同時會隨著它在語料庫中出現的頻率成反比下降。本文使用的語料庫即1978年至2019年政府工作報告文本。

5.涉及合并的詞語:反腐包括了反腐倡廉、反腐敗、腐敗、反腐;城鎮包括了城市、城鎮;霧霾包括了PM2.5、霧霾。

來源:網絡整理

推薦閱讀
分享到:

Copyright © 2002-2016 北京體育廣播 All rights reserved 

刪稿聯系郵箱:[email protected]
鄭重申明:未經授權禁止轉載、摘編、復制或建立鏡像.如有違反,追究法律責任
深圳免费六合图库