機械学習で薬機法違反サイト対策するよ 当初の計画

機械学習を使い、薬機法違反サイトの対策をしてみたい。現状の予定としては、下記の機能の開発に考えている。

概略

最近の薬機法違反サイトは、広告で集客しているらしい。広告欄の飛び先サイトを色々と調べて、調査してみたい。

開発する機能の概略

以下の機能を開発する予定である。機械学習を使う。

  • Yahoo!ニュースの個別記事URLを取得する機能(スクレイピング)
  • Yahoo!ニュースの広告欄飛び先サイトの文章を取得する機能
  • (機能ではないタスク)薬機法違反サイトを人間が判定(教師データ作成のため人間が目と頭で判断)
  • 薬機法違反判定の機械学習モデル?(既存のライブラリで教師データを使い作成)
  • (機能ではないタスク)作った機械学習モデル?で、しばらく薬機法違反を調査
  • (機能ではないタスク)有識者に調査結果を見せて、有益な判定ができているか確認する

これを、2ヶ月程度、2月末までに行いたい。

がんばるぞ。

以上

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください