ニュース分析のためのマクロを作ってみる #1
連日、愛知県内のコロナ感染者のグラフを作成していますが、元々こんなニュースを引用しています。
毎回毎回記事を解読してExcelにポチポチ入力するのも芸が無いので、マクロを組んで多少なりとも楽を出来たらなと思います。
と言うことで、まずは今自分が手作業でやっていることの流れをフローにしてみます。
①そろそろ今日のニュースが更新される頃だなー。と思う。
②東海テレビのニュースサイトを開く
③該当する記事を選ぶ
④中身を見て感染者数などの数字を読み取る
⑤Excelに転記する
⑥グラフの範囲を更新する
⑦グラフをコピーしてブログに貼付け
⑧コメントとか追記して投稿
意外とたくさんステップがありました。①はアラーム、②はブックマークというスーパーな機能を開発してくれた人が既にいるので、その先から取り組みたいと思います。(③以降が完成したらゆくゆくはここも自動化したい)
形態素解析
まず、記事からデータを抽出するに当たって形態素解析が必要になります。形態素解析の詳しい説明は別のサイトとかに譲りますが、要は、文章から意味のある単語を抽出する時に使う技術です。
これを使わない場合は、正規表現でパターンマッチングみたいなことをして直接抜き出す事も可能ですが、記事の微妙な表現の違いが出てきたときにいちいちゼロから考え直さなきゃいけないので、一旦形態素解析が良いのでは無いかなと思いました。
で、簡単に形態素解析を使う方法ですが、実はExcelマクロからWordを呼び出し、Word内のスクリプトを呼び出す。と言う方法があり、これが簡単かつ開発環境の準備が要らなくてどのPCでもできそうなのでこれをやることに決めました。
コメント
コメントを投稿