統計学:SteamSpyから見るSteamの統計解析(機械学習を使わずExcelで古典的に解析)

☆調査の目的

Steamのコンテンツの概要を読み取って上位コンテンツの特徴量を機械学習の手法を使わずに割り出す。参考書はオライリーの「仕事ではじめる機械学習」。アルマジロ絵が表紙の新刊です。結局pythonを多く使ってますのでPGいらずと割り切って買うと損します。その反面実用性と応用性に富んでいるので社会人にこそオススメできるナス。なお、サムネはhttps://steamspy.com/より引用。

☆統計手法

https://data.world/craigkelly/steam-game-data←ここからcsv落としてExcelで解析する。必要であればさらにクローラを作る。無理でも作る。無理でも作る(重要なので三回言いました)。csvがあれば機械学習を使わんでもけっこう深く分析はできる。

ジャンルでのトレンド割り出しは重要ですね。御覧の通りインディータイトルが流行。中でもアクションゲームがかなりの割合を占めています。次点にシミュレーションと来ます。アドベンチャーは重複の割合があるのでどっちともいえないと思います。MMOタイトルやスポーツ・レーシングタイトルは絶対数が少なくて、F2Pゲームの割合も少なめ。アーリーアクセスはそれなりですが多くはない。

市場に出回ったばかりのタイトルのはじめの平均価格は9ドル付近。最終的には大体0.5ドルぐらい落ちます。時間とともに割安になっていくといっても結果タイトルの全平均をみていくと50~100円ほどしか落差が見て取れません。全体を見てみてもそれほどお得感は平均レベルではないということがわかりますね(ただしセールなど特割の影響を除く)。

こいつは重複があるので一概には言えませんが、Winプラットフォーム以外にもそれなりにMac/Linuxタイトルも取り扱いは多いです。昨今のマルチプラットフォームの流れはSteamの基本方針のうちのひとつですし、彼らの作ったLinuxベースのSteamOSの存在も影響しているかもしれません。

オーナー数(当該ゲームを所持している人数のこと)とアクティブプレイヤー数(当該ゲームを継続的にプレイしている人数のこと)から導き出した。見てみると、まず、上位のゲームはインフレしまくってます。よーするにSteamの中でやはり人気ゲームと不人気ゲームの格差がでかいってこと。人気タイトルには絶対的にユーザも集まるけど、不人気タイトルやトントンのものはそれなりということがわかります。タイトル名を見ていけばわかりますが、オンラインタイトルは強いアクティブプレイヤー数を持っていますが、売れただけであまり遊ばれていないオフタイトルの多さも見逃せまん。このグラフでブルー部位とオレンジ部位のヒラキが多いところはそういう、売れただけで継続して遊ぶSteamerが少ないタイトルである可能性が高いということが理解できる。

最後に、メタスコアの評価を上位10位ごとに50タイトルを見ていきました。結果見ていくと、確かに上位付近にある人気ゲームのメタスコアは85点と平均していい感じですが、それ以降は必ずしもそうとなってはおらず、例えば二番目を見ればわかるように(上位11~20位)一気にガクッと落ちてます。なんとここで80点割ってますし、それ以降の50位まででむしろ平均のメタスコアはかねがね80前後で揺れ動いておるので、このメタスコアがユーザーから支持され遊ばれているゲームごとに、完璧に相対する適当となる指標ではないということがよくよくわかります。

☆まとめ

・インディータイトルおよびアクションゲームタイトル多し。
・タイトルの平均価格を見ていくと大体9ドル付近に集中する。
・マルチプラットフォームの影響もあるためかMac/Linux対応タイトルは少ないわけではない。
・Steamで配信されているゲームの中でその「人気格差」は大きいものがある。
・上位に行けば行くほどその格差は顕著になる。
・多くのSteamerに買われても継続的に遊ばれないオフゲーもしばしば見受けられる。
・メタスコアと人気ゲームの関係性は(一定程度の目安を除いて)当てにならん。

marikoi

ここの主筆・共同管理人。ぶっちゃけ狂人。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA