薬機法違反サイト検知システム概略
現在、薬機法違反サイト検知システムを開発中。このページでは、そのプランを書く。
解決したい課題
現在のインターネット上には、薬機法違反サイトが大量にあるらしい。
薬機法とは、健康情報に関して間違った情報が氾濫しないように防止する法律である。
薬機法違反サイトとは、つまり、間違った健康情報を流すサイトだ。
それらのサイトの多くは、商業目的で薬機法違反を行っている模様。営利目的で、一般消費者の健康を傷付けているわけだ。だから、そのようなサイトを駆逐したい。
2016年に、Welq問題に火が付き、Welqは閉鎖された。しかし、Welq以前・以後で、薬機法違反サイトは減っていない、と広告審査を行う人から聞いた。だから作ろうと決めた。
作りたい機能
作りたい機能は以下の通り。
- インターネット上を自動的にクロールする
- クロールしたサイトそれぞれについて、薬機法違反かどうかを判定する
- 判定結果を一覧出力する
システム構成概略
システム構成/内容は以下の通り。
- 利用する技術
- selenium
- C#
- PHP
- JavaScript
- MySQL
- AI(Python機械学習ライブラリ)
- 機能と利用技術の紐付け
- インターネット上を自動的にクロールする
- selenium
- C#
- MySQL
- クロールしたサイトそれぞれについて、薬機法違反かどうかを判定する
- AI(Python機械学習ライブラリ)
- MySQL
- 判定結果を一覧出力する
- PHP
- MySQL
- JavaScript
- インターネット上を自動的にクロールする
想定顧客
健康食品の販売元。
薬機法違反サイトは、特定の商品の販売を目的として運営されていることが多いと思われる。薬機法違反サイトを放置すると、その商品の販売元が罪に問われる。そのサイト自体が、商品の販売元が運営しているかどうかに関係なく、販売元が法的リスクを負う。
また、健康情報に絡むウェブサイトは、健康食品の広告サイトであることが多いと思われる。
そのため、このシステムの想定顧客は、健康食品の販売元である。
以上