データに基づいたQ&Aサイト改善 画像を含む投稿の割合の算出

前回、各投稿の長さを算出したので、引き続き画像を算出したい。投稿文のhtmlの中にimgタグが含まれており、画像自体はAmazon S3に格納されている。

まず、画像があれば1、なければnullとなるMeasureを追加し、has_imgと名付ける。REGEXP_MATCHという関数があり、これは第二引数の正規表現にマッチすればtrue, そうでなければfalseを返す関数だ。

if REGEXP_MATCH([Content],’<img’) then 1 else null end

次に、全体の中で画像を持っている投稿の割合を%で算出する。画像がある投稿はhas_imgのカラムに1が入っているので、その数を数える。あとは単純に投稿の和で割る。

count([has_img]) / count([Type]) * 100

この比率の過去2年間分をチャートにした。質問に添付される画像は2年前の3倍程度に増えているが、回答とコメントでの画像の利用はほぼ一定であることが分かった。

2016年末にデザインを変えたが、それ以前も大きく伸びている、ユーザーの多数が高齢であることから、サイト操作に慣れて画像が添付できるようになったことも大きそうだ。

One clap, two clap, three clap, forty?

By clapping more or less, you can signal to us which stories really stand out.