機械学習で薬機法違反サイト対策するよ 当初の計画
機械学習を使い、薬機法違反サイトの対策をしてみたい。現状の予定としては、下記の機能の開発に考えている。
概略
最近の薬機法違反サイトは、広告で集客しているらしい。広告欄の飛び先サイトを色々と調べて、調査してみたい。
開発する機能の概略
以下の機能を開発する予定である。機械学習を使う。
- Yahoo!ニュースの個別記事URLを取得する機能(スクレイピング)
- Yahoo!ニュースの広告欄飛び先サイトの文章を取得する機能
- (機能ではないタスク)薬機法違反サイトを人間が判定(教師データ作成のため人間が目と頭で判断)
- 薬機法違反判定の機械学習モデル?(既存のライブラリで教師データを使い作成)
- (機能ではないタスク)作った機械学習モデル?で、しばらく薬機法違反を調査
- (機能ではないタスク)有識者に調査結果を見せて、有益な判定ができているか確認する
これを、2ヶ月程度、2月末までに行いたい。
がんばるぞ。
以上