SlideShare una empresa de Scribd logo
1 de 75
Descargar para leer sin conexión
約173万ツイートを調査して分かった
     Twitterの利用動向

           @teapipin
           2012.08.01
   Twitter 勉強会 #twtr_hack
自己紹介
• HN :てぃー
• ID:@teapipin
• 本名:Shigeo Okada

• ブログ:creativi.tea
       (クリエイティビティ)

• 趣味でアプリ開発
自己紹介
• HN :てぃー
• ID:@teapipin
• 本名:Shigeo Okada

• ブログ:creativi.tea
       (クリエイティビティ)

• 趣味でアプリ開発
自己紹介
• HN :てぃー
• ID:@teapipin
• 本名:Shigeo Okada

• ブログ:creativi.tea
       (クリエイティビティ)

• 趣味でアプリ開発
• iPhoneアプリ



      年齢計算★            学歴欄作成           e-スペル
                        (公開停止中)        (暗記用アプリ)


• Macアプリ (Vectorにて)



  Interval Timer EX   デジカメ撮影日を       デジカメ変更日を撮影日に
  (インターバルタイマーEX)      一括変更 for Mac   一括変更 for Mac
自己紹介
• 学生時代:コンピュータによる遺伝子解析
 – 使用言語:Perl


• PG/SE時代:集計システムの開発
 – 使用言語:Visual Basic、VBA


• 現在:経済系の大学
今日のテーマ
• Twitterの利用動向を知るために
  約173万ツイートを調査したので報告

• ブログで13の記事に分けて紹介したものを補足
 – ツイート数、はてブ数、いいね数、検索数が多かった
   記事の内容をピックアップ
 – ブログでは省略した説明も
 – ブログに未掲載の情報も(後日ブログに追記予定)

• クライアントの開発に活用
事の発端
• Twitterのアプリやサービスを作ってみたいなぁ
• 特に位置情報を使った情報の広がりをテーマにし
  てみたいなぁ

じゃあ、
 – どんなTwitterクライアントが人気あるんだろう?
 – 位置情報からどの地域のツイートが多いんだろう?


など全体を調査したものを検索して探してみたら・・・
ない!?
ちょっとはあったけど、


いい情報がない!
あったのは、
• 海外の調査
 – 日本の動向とは違うはず
• ユーザへのアンケート集計
 – 偏りあり。無意識で行っていることは分からない
• 指定ユーザの統計(ウェブサービス)
 – 全体の動向が分からない
• 古いデータ(~2010年頃)
 – 今の動向とは違うはず
• サンプル数が少ない
 – 一般化できない
• 細かく分類されていない
 – 調べたい組み合わせがなかったりする
ないなら自分で調べてみることに
• 「Twitter API ポケットリファレンス」
• @yusukeさん著

• 理解しやすい本
• Twitter4Jは直感的で分かりやすく、
  すぐに調査に入れた
ツイートの取得について
ツイートの取得方法
• Twitter4JでStreaming APIのsampleを使用
  – 公開ツイートのうち約1%データが取得できる
  – 注意:複数接続しても同じデータしか取得できない


• 次の情報を取得
  –   タイムゾーン     :getTimeZone()
  –   位置情報       :getGeoLocation()
  –   日時         :getCreatedAt()
  –   クライアント     :getSource()
  –   ユーザID      :getScreenName()
  –   ツイート       :getText()
  –   公式リツイートか否か :isRetweet()
日本語のみのツイートを選別
• タイムゾーンからでは判断できない
 – nullや(なぜか)Hawaii、 Irkutsk(イルクーツク:ロシア領)が多い
• getLang(言語設定の取得)でも判断できない
 – 例) ”en”でも日本語のツイート、”jp”でも英語のツイートあり

• ツイートが日本語かで判断した
 –   1文字ごとにCharacter.UnicodeBlockで判定
 –   詳細は http://teapipin.blog10.fc2.com/blog-entry-281.html
 –   実際はこれでも中国語やアラビア語?などがあった
 –   情報処理学会などの論文では「ひらがな・カタカナ」を含むも
     ののみを取得していることが多い。しかしこれでは記号の
     み、顔文字のみが取得できない

 – 結局最後は手作業で判断(約2万ツイート除去)
重複データを除去
• なぜか全く同じデータが一部含まれていた

• 理由は不明だが除去
取得データ
• 期間:
  2012/05/17(木)0:00 ~ 20(日)23:59
   の4日間

• ツイート数:
  172万5212 ツイート(日本語のみ)

• ユーザ数:
  92万6150 ユーザ
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
ビッグイベント
• 21(月)金環日食
• 22(火)東京スカイツリー開業

• ビッグイベントでは通常とは傾向が異なるため
  除外

• 月~水曜の傾向は木曜で代替できると仮定
紹介する調査結果
•   Twitterクライアント(アプリ、サービス)
•   曜日別・時間帯別
•   ツイートの種類別
•   機器別
•   位置情報



• 他はブログに
紹介する調査結果
•   Twitterクライアント(アプリ、サービス)
•   曜日別・時間帯別
•   ツイートの種類別
•   機器別
•   位置情報
Twitterクライアント(アプリ、サービス)
順位            利用アプリ名           個数      割合(%)     順位            利用アプリ名           個数 割合(%)
 1位   Twitter for iPhone    251,414    14.57%   31位   TweetCaster for Android   6,062 0.35%
 2位
 3位
      Twitter for Android
      web
                            209,290
                            180,538
                                       12.13%
                                       10.46%
                                                32位
                                                33位
                                                      HootSuite
                                                      ShootingStar
                                                                                5,930 0.34%
                                                                                5,771 0.33%
                                                                                              • すべてで
 4位
 5位
      Keitai Web
      twittbot.net
                            131,918
                            100,952
                                        7.65%
                                        5.85%
                                                34位
                                                35位
                                                      OpenTween
                                                      Tweet ATOK
                                                                                5,516 0.32%
                                                                                5,341 0.31%
                                                                                                1万5108種類
 6位   twicca                  93,542    5.42%   36位   ついっぷる Pro for iPhone      5,005 0.29%
 7位   ついっぷる/twipple           63,854    3.70%   37位   TwitBird                  4,962 0.29%
 8位
 9位
      Janetter
      SOICHA
                              47,559
                              43,759
                                        2.76%
                                        2.54%
                                                38位
                                                39位
                                                      ツイ助。
                                                      Twitter for iPad
                                                                                4,772 0.28%
                                                                                4,749 0.28%   • 上位4位は公式
10位   Echofon                 39,672    2.30%   40位    mixi ボイス                 4,093 0.24%
11位   Tween                   33,583    1.95%   41位   Twil2                     3,860 0.22%
12位   ついっぷる for iPhone        24,391    1.41%   42位   Tweetlogix                3,630 0.21%
13位
14位
      TweetDeck
      jigtwi
                              22,597
                              21,987
                                        1.31%
                                        1.27%
                                                43位
                                                44位
                                                      Seesmic
                                                      Instagram
                                                                                3,626 0.21%
                                                                                3,622 0.21%
                                                                                              • それぞれ機能
15位   モバツイ / www.movatwi.jp 18,030      1.05%   45位   ニコニコ動画                    3,565 0.21%     が異なる
16位   Twipple for Android     17,759    1.03%   46位   BotMaker                  3,503 0.20%
17位   ついっぷる for iPhone        16,749    0.97%   47位   jigtwi for Android        3,425 0.20%
18位   Mobile Web              16,175    0.94%   48位   Krile2                    3,379 0.20%
19位
20位
      Tweet Button
      Tweetbot for iOS
                              16,001
                              15,535
                                        0.93%
                                        0.90%
                                                49位
                                                50位
                                                      Twitter for BlackBerry
                                                      foursquare
                                                                                3,232 0.19%
                                                                                2,951 0.17%
                                                                                              • Javaのものは
21位
22位
      Saezuri                 12,412
      モバツイ / www.movatwi.jp . 12,360
                                        0.72%
                                        0.72%
                                                51位
                                                52位
                                                      TwitCasting
                                                      Teewee
                                                                                2,776 0.16%
                                                                                2,522 0.15%
                                                                                                Twitter4Jを使っ
23位
24位
      yubitter
      Twipple for Android
                              11,590
                              10,154
                                        0.67%
                                        0.59%
                                                53位
                                                54位
                                                      Ustream.TV
                                                      Twitter for Mac
                                                                                2,337 0.14%
                                                                                2,323 0.13%
                                                                                                ているものが多
25位   YoruFukurou             10,056    0.58%   55位   TweetList Pro             2,300 0.13%     い
26位   ツイタマ                     9,419    0.55%   56位   twitbeam[ツイットビーム]        2,240 0.13%
27位   TweetList!               8,920    0.52%   57位   Twipple Pro for Android   2,164 0.13%
28位   EasyBotter               8,893    0.52%   58位   PlayStation Vita          2,030 0.12%
29位   twitterfeed              6,590    0.38%   59位   Google                    1,983 0.11%
30位   dlvr.it                  6,283    0.36%
Twitterクライアント別のツイート数
    300,000                                                                                                    100%

                                                                                                               90%
    250,000
                                                                                                               80%

                                                                                                               70%
    200,000

                                                                                                 個数
                                                                                                               60%
                                                                                                 累積(%)            累
個   150,000                                                                                                    50%積
数                                                                                                                 (
                                                                                                                  %
                                                                                                               40%)

    100,000
                                                                                                               30%

                                                                                                               20%
     50,000

                                                                                                               10%

          0                                                                                                    0%
              1   3   5   7   9   11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59
                                                             順位
Twitterクライアント別のツイート数
    300,000                                                                                                    100%

                                                                                                               90%
    250,000
                                                                                                               80%

                                                                                                               70%
    200,000

                                                                                                 個数
                                                                                                               60%
                                                                                                 累積(%)            累
個   150,000                                                                                                    50%積
数                                                                                                                 (
                                                                                                                  %
                                                                                                               40%)

    100,000
                                                                                                               30%

                                                                                                               20%
     50,000

                                                                                                               10%

          0                                                                                                    0%
              1   3   5   7   9   11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59

    • 上位5位で約50%を占める寡占市場順位

    • 60位以下が約10%を1万5049種類が占める長いロングテール
ここまでのまとめ
• 上位1~4位は公式が占めている

• 上位5位で約50%を占める寡占市場

• 長いロングテール(文字どおりの意味での)


• ユーザは用途別に複数のTwitterクライアントを
  使い分けている
• 新規参入は容易で、ユーザのニーズを捉えれば
  必ず使ってもらえる
紹介する調査結果
•   Twitterクライアント(アプリ、サービス)
•   曜日別・時間帯別
•   ツイートの種類別
•   機器別
•   位置情報
• 平日よりも週末の方が多く、特に日曜は多い
海外との比較
• 2009年 全世界の2000万ツイート
   月         火         水         木         金         土         日




       出典:Sysomos Inc. http://www.sysomos.com/insidetwitter/
• 8、12時台にピーク、夕方以降は増加傾向
• 夜は金曜の方が少ない
• 朝からゆるやかに増加、19時台以降増加、大きなピークなし
• 日曜は他の曜日よりも深夜も多い
海外との比較




出典:Sysomos Inc. http://www.sysomos.com/insidetwitter/
ここまでのまとめ
• 海外と日本とは異なる傾向を持つ

• 平均的な日本人のライフスタイルの
  空いた時間と密接に関係している
紹介する調査結果
•   Twitterクライアント(アプリ、サービス)
•   曜日別・時間帯別
•   ツイートの種類別
•   機器別
•   位置情報
ツイートの種類別
• リツイート(公式RT、非公式RT)

• リプライ・メンション(宛先(@~)を含むもの)

• ハッシュシュタグ・リンク入りつぶやき
  (RT、リプライ・メンションを除く)

• 純粋なつぶやき
ツイートの種類別
      ハッシュタグ・   公式RT
      リンク入りつ    7.92%
                        非公式RT
        ぶやき
                         2.30%
       17.01%




                            リプライ・メン
                              ション
                             37.00%
     純粋なつぶ
       やき
      35.77%
                  リプライ・メンションは宛先(@~)を含むもの
                  ハッシュタグ・リンク入りはRT、リプライ・メンションを除く




• リツイートは公式・非公式合わせて10.23%
ツイートの種類別
      ハッシュタグ・   公式RT
      リンク入りつ    7.92%
                        非公式RT
        ぶやき
                         2.30%
       17.01%




                            リプライ・メン
                              ション
                             37.00%
     純粋なつぶ
       やき
      35.77%
                  リプライ・メンションは宛先(@~)を含むもの
                  ハッシュタグ・リンク入りはRT、リプライ・メンションを除く



• 純粋なつぶやき以外はコミュニケーションとしてのやり
  とりであり、64.23%を占める
ここまでのまとめ
• ツイッターは人とのコミュニケーションのツー
  ル
• ツイッター本来の目的である純粋なつぶやき
  は35.77%
紹介する調査結果
•   Twitterクライアント(アプリ、サービス)
•   曜日別・時間帯別
•   ツイートの種類別
•   機器別
•   位置情報
機器別
• Twitterクライアントでの上位59位(90.98%)を
  5つに分類
                     PC/携帯,   WEB, 2.3%
                       4.0%
             bot, 8.0%




      PC, 23.9%




                                   携帯, 61.9%
• 木~土曜は似た傾向
• 携帯機器、PCは変動。botはどの時間帯もほぼ一定数
• 朝と昼は携帯機器が重要。夜はPCも
• 他の曜日とは異なり、朝にPCが見られる
• 他は同様の傾向
紹介する調査結果
•   Twitterクライアント(アプリ、サービス)
•   曜日別・時間帯別
•   ツイートの種類別
•   機器別
•   位置情報
位置情報(Geo Location)
    位置情報付き     うち日本     うち外国   位置情報なし
木      0.16%    0.15%    0.01%   99.84%
金      0.16%    0.16%    0.01%   99.84%
土      0.22%    0.21%    0.01%   99.78%
日      0.19%    0.18%    0.01%   99.81%
計      0.18%    0.18%    0.01%   99.82%
                         ※位置情報の付いたもののみ
                          (地図へのリンクのみは除く)

• 全体でたったの0.18%しか付与されていない
• 日本のものは3047ツイート、外国のものは144ツイート

• 次のスライドからはすべて日本のもののみの結果
位置情報付きTwitterクライアント
順位    全体                 名称             個数 割合(%)
 1位    50位    foursquare                1086 39.49%   • すべてで140種類
 2位     1位    Twitter for iPhone         651 23.67%
 3位     2位    Twitter for Android        359 13.05%
 4位    44位    Instagram                  171  6.22%
 5位
 6位
       97位
       18位
              ロケタッチ(loctouch)
              Mobile Web
                                         163
                                          54
                                              5.93%
                                              1.96%
                                                      • 位置情報サービス
 7位   173位    Path 2.0                    33  1.20%     が約47%以上
 8位   641位    RADIO WAVE API              26  0.95%
 9位   768位    FU-TOWN                     25  0.91%
10位   430位    今ココなう!iPhone                23  0.84%
11位
11位
        6位
      1002位
              twicca
              AgenaStar
                                          20
                                          20
                                              0.73%
                                              0.73%
                                                      • 2、3位は公式
13位   1062位   FutownNewsVer5              19  0.69%
13位   314位    今ココなう!Android               19  0.69%
15位   458位    モバイルフォースクエア                 16  0.58%
16位   1218位   SyougaSuite                 15  0.55%   • 店舗情報、天気など
16位   1371位   FutownEvent                 15  0.55%
18位    86位    Photos on iOS               12  0.44%     その地点の情報を
18位
20位
      1736位
       31位
              cpSTYLE(クーポンスタイル)
              TweetCaster for Android
                                          12
                                          11
                                              0.44%
                                              0.40%
                                                        知らせるものもある
木曜 位置情報付きTwitterクライアント別
60




50                                                                                                                 その他

                                                                                                                   ロケタッチ
40
                                                                                                                   (loctouch)
                                                                                                                   Instagram
30
                                                                                                                   Twitter for
                                                                                                                   Android
20
                                                                                                                   Twitter for
                                                                                                                   iPhone

10                                                                                                                 foursquare



 0
     0   1   2   3   4   5   6   7   8   9   10   11   12   13   14   15   16   17   18   19   20   21   22   23
                                                  時間帯


         • どの曜日も似た傾向
         • 朝~夕方はfoursquareの増減が全体に影響
         • 夜は公式とその他が影響
都道府県別
    • 大都市やその
      隣接地域で多い

    • 人口と関係が
      ありそう
人口との相関
     • 正の相関
ここまでのまとめ
• 人口が多い地域ほど、 位置情報の付いたツイート数
  も多い
• 人口が多いのだからツイート数が多いのは当たり前と
  考えてよいのか?

• それは違う!
• わざわざ位置情報を付けているのは普通のツイートと
  は異なる何か特別な意味があると考えるべき
• にもかかわらず、人口と相関が強いのはなぜか?


 位置情報付きのツイートの内容を見る必要がある
位置情報とツイート内容の関係
• 位置情報付きツイートの内容からツイート自体
  が位置を意識したものかで分類

• (例)
    位置情報     ツイート         分類
   レストラン   おいしい     →   飲食店
   レストラン   あらら      →   関係なし
   レストラン   (店舗情報)   →   地点
位置情報とツイート内容の関係
順位         場所   個数      割合
 1位
 2位
      関係なし
      駅
                1021
                 379
                       33.51%
                       12.44%
                                • 関係なしが33.51%を占め
 3位   飲食店        347   11.39%     る
 4位   商業施設       344   11.29%
 5位   地点         212    6.96%
 6位   道路         155    5.09%
 7位
 8位
      イベント会場
      コンビニ
                  69
                  53
                        2.26%
                        1.74%
                                • 駅、飲食店、商業施設な
 9位   学校          52    1.71%     ど日常使う場所からのツ
10位   スポーツ施設      45    1.48%
11位   自宅          42    1.38%
                                  イートが多い
12位   公園          40    1.31%
13位   オフィス        36    1.18%
14位   空港          24    0.79%
15位   テーマパーク      23    0.75%   • イベント会場、テーマパー
16位   宿泊施設        20    0.66%
17位   寺社          19    0.62%
                                  クなどイベント、観光地か
17位   公共施設        19    0.62%     らもある
19位   バス停         16    0.53%
20位   博物館・美術館     15    0.49%
都道府県(上位)別 位置情報とツイート内容の関係
250




200




150

                                                                                      東京都
                                                                                      神奈川県
100                                                                                   大阪府
                                                                                      愛知県
                                                                                      埼玉県
                                                                                      千葉県
 50




  0
      関   駅   飲   商   地   道   イ   コ   学   ス   自   公   オ   空   テ   宿   寺   公   バ   博
      係       食   業   点   路   ベ   ン   校   ポ   宅   園   フ   港   ー   泊   社   共   ス   物
      な       店   施           ン   ビ       ー           ィ       マ   施       施   停   館
      し           設           ト   ニ       ツ           ス       パ   設       設       ・
                              会           施                   ー                   美
                              場           設                   ク                   術
                                                                                  館
木曜 位置情報とツイート内容の関係
70


60
                                                                                          その他
                                                                                          その他イベント関係
50
                                                                                          スポーツ施設
                                                                                          学校
40
                                                                                          コンビニ
                                                                                          イベント会場
30
                                                                                          道路
                                                                                          地点
20                                                                                        商業施設
                                                                                          飲食店
10                                                                                        駅
                                                                                          関係なし
 0
     0   1   2   3   4   5   6   7   8    9   10 11 12 13 14 15 16 17 18 19 20 21 22 23
                                                 時間帯


         • 木曜・金曜は似た傾向
         • 上位のものが大部分を占める
         • 朝は駅、昼は飲食店、夜は関係なし、深夜は地点が多い
日曜 位置情報とツイート内容の関係
70


60
                                                                                          その他
                                                                                          その他イベント関係
50
                                                                                          スポーツ施設
                                                                                          学校
40
                                                                                          コンビニ
                                                                                          イベント会場
30
                                                                                          道路
                                                                                          地点
20                                                                                        商業施設
                                                                                          飲食店
10                                                                                        駅
                                                                                          関係なし
 0
     0   1   2   3   4   5   6   7   8    9   10 11 12 13 14 15 16 17 18 19 20 21 22 23
                                                 時間帯


         • 土曜・日曜は似た傾向
         • 駅は9時以降増加、商業施設・道路が多い
         • イベント関係は午前に多い
ここまでのまとめ
• 位置情報と関係のない内容のツイートが1位
 – ユーザはツイートに位置情報が付いていることに気付い
   てない?
 – 特別な時に位置情報を付けるのではなく、ふだんから付
   けている
• 駅 、飲食店、商業施設など日常使う場所からのツ
  イートが多く、ライフログ・ポイント取得としての性格が
  強い

• 位置情報付きでも人口の多い都市圏のツイートが多く
  なる
• イベントや観光地からのツイートはあるが、少ないた
  め埋もれている
参考
書籍
• 「Twitter API ポケットリファレンス」
• 「Rによるデータサイエンス - データ解析の基礎から最
  新手法まで」

フリーソフト、サービス
• Twitter4J
• Pleiades All in One (Eclipse + Java)
• R (統計ソフト)
• MANDARA (地図ソフト)
• usoinfo reverse geocoder (緯度経度→住所変換)
• Google マップ
(質問と回答) #twtr_hack #qに対して
• sampleでデータとり続けて、1日でだいたいどれくらいの
  データ量(ディスクに保存して何MBとか)になるんですか?
  – TSV(タブ区切り)形式で、木・金曜:約74MB、土曜:約76MB、日
    曜:約84MB

• botとそうでないのは "from" を見て区別?
• botの区別は確かにどうやるのでしょう
  – 取得データのSource(クライアント)から判断しました。
    "from"と同義です

• 場所についてはツイート内容から判断?実際の場所にどん
  なものがあるか(地図とか)は調べてない?
  – GeoLocationの緯度経度から地図を見て実際に何があるかを調
    べました
(付録)
• 以下のスライドは当初の案では発表予定だっ
  たけど時間の都合上使わなかったもの
Twitter APIの仕様上の限界
• 閲覧数(ROM数)は分からない
• リンク先に移動したかどうか分からない

• sampleで取得できる約1%の意味が曖昧

など
海外との比較
• 2009年 全世界の2000万ツイート
                                        当時は、
                                        • アメリカ 62.14%
                                        • 日本 11位(0.71%)

                                        • 事実上、欧米の調査




 出典:Sysomos Inc. http://www.sysomos.com/insidetwitter/
機器別・曜日別のツイート数の割合(%)
    0%   10%   20%    30%      40%   50%   60%   70%       80%       90%         100%

                                                                 3.97%

木                     62.45%                      23.04%                   8.25%

                                                                         2.29%

                                                                 3.99%
                                                                                        携帯
金                     62.22%                      23.07%                   8.45%
                                                                                        PC
                                                                         2.27%          PC/携帯

                                                                 3.99%                  WEB
                                                                                        bot
土                     61.60%                      24.05%                   8.12%

                                                                         2.25%

                                                                 3.92%

日                     61.29%                      25.10%                   7.43%

                                                                         2.26%


     • どの曜日もほぼ同じ割合
寄与度(%)とは
• GDP(国内総生産)などの経済分野での時系列分
  析でよく使われる手法
• あるデータ全体の変化に対してその構成要素であ
  る個々のデータの変化がどのように貢献している
  かを示す指標
• HPやブログのアクセス解析でも有効な手法
• ここでは基準を木曜に
 <日曜の携帯機器の場合>
  (日曜の携帯機器-木曜の携帯機器)
                      × 100
         木曜の計
• ツイート全体の増減には携帯機器が大きく関係している
紹介する調査結果
•   Twitterクライアント(アプリ、サービス)
•   曜日別・時間帯別
•   ツイートの種類別
•   機器別
•   文字数
•   位置情報
多い文字(本文のみ)
 順位        ツイート     個数    順位         ツイート    個数
  1位   おはようございます    289   16位   おはようございます!    85
  2位   おはよー         261   17位   おはよ           83
  3位   ただいまー        251   18位   離脱            77
  4位   おはよう         214   19位   むくり           76
  5位   ただいま         189   20位   おなかすいた        75
  6位   おやすみ         176   21位   ほかいまー         73
  7位   おやすみなさい      174   22位   あー            69
  8位   眠い           161   23位   (´へωへ`*)      68
  9位   ねむい          152   24位   ただいま!         61
 10位   おはようございます。   147   24位   ただいまー!        61
 11位   あ            129   26位   !?            60
 12位   よるほー         125   27位   はい            59
 13位   帰宅           116   28位   寝る            56
 14位   おやすみー         90   29位   疲れた           54
 15位   ねむ            87   30位   おやすみなさい。      53

• 挨拶と感情が大半を占める
• 状況を表すものも多い
ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack
25%      50%               25%

• 平均43.5文字
• 140文字が最も多い (うち、公式RT:80.0%、非公式RT:5.0%)
• 20~57文字が50%を占める
25%      50%               25%

• 平均43.5文字
• 140文字が最も多い (うち、公式RT:80.0%、非公式RT:5.0%)
• 20~57文字が50%を占める
Twitterクライアント別の平均文字数(上位30位)
                                 0   10   20   30   40   50   60   70   80   90   100 110 120 130 140
                twitterfeed
     Twitter for BlackBerry
                    ツイ助。
              Tweet Button
                     Google
                       dlvr.it
              ニコニコ動画
                Ustream.TV
                  HootSuite
                 foursquare
                  BotMaker
                TwitCasting
                 EasyBotter
           Twitter for Mac
           Twitter for iPad
                        web
      Twipple for Android
 ついっぷる Pro for iPhone
       ついっぷる/twipple
  TweetCaster for Android
   ついっぷる for iPhone
                    TwitBird
       Twipple for Android
                    Seesmic
   Twipple Pro for Android
    ついっぷる for iPhone
               twittbot.net
                  Instagram
               Mobile Web
モバツイ / www.movatwi.jp
箱ひげ図とは
25%       50%        25%

      中央値(平均値ではない)         外れ値(異常値)
箱ひげ図とは
25%       50%         25%

      中央値(平均値ではない)               外れ値(異常値)




                     ヒストグラムと対応
文字数
ここまでのまとめ
• PC、携帯機器からとも20~60文字ほどが最も
  多く50%を占める
• PC 、携帯機器からで文字数に差は見られない
• 昔のように「ケータイのメールは短く、詳細は
  PCで」ということはない
• botからは定型文が多いため、文字数の幅は
  少ない
木曜 位置情報付きツイート



位
置                           全
情                           体
報




    • 木曜・金曜では朝から夕方までは全体の増減に伴って
      増減、夜からは全体の増減に伴わない
日曜 位置情報付きツイート



位
置                           全
情                           体
報




    • 土曜・日曜では朝から昼くらいまでは全体の増減に
      伴って増減、他の時間帯ではそうでもない

Más contenido relacionado

Destacado

「採用学」に学ぶ、優秀な人材の育て方 先生:服部 泰宏
「採用学」に学ぶ、優秀な人材の育て方 先生:服部 泰宏「採用学」に学ぶ、優秀な人材の育て方 先生:服部 泰宏
「採用学」に学ぶ、優秀な人材の育て方 先生:服部 泰宏schoowebcampus
 
ラフティング型人間のキャリア形成戦術Ver.2.1
ラフティング型人間のキャリア形成戦術Ver.2.1ラフティング型人間のキャリア形成戦術Ver.2.1
ラフティング型人間のキャリア形成戦術Ver.2.1Yataro256
 
Yahoo! JAPAN 販促EXPO2015 宮坂学講演資料
Yahoo! JAPAN 販促EXPO2015 宮坂学講演資料Yahoo! JAPAN 販促EXPO2015 宮坂学講演資料
Yahoo! JAPAN 販促EXPO2015 宮坂学講演資料yahoojapan_pr
 
データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)Takashi J OZAKI
 
『プロフェッショナルとして生きるキャリア論 -10個のヒント-』
『プロフェッショナルとして生きるキャリア論 -10個のヒント-』『プロフェッショナルとして生きるキャリア論 -10個のヒント-』
『プロフェッショナルとして生きるキャリア論 -10個のヒント-』Shinichi Takamiya
 
ホラクラシー型組織~実際に8年経営してわかったこと~(ホラクラシーのメカニズム)
ホラクラシー型組織~実際に8年経営してわかったこと~(ホラクラシーのメカニズム)ホラクラシー型組織~実際に8年経営してわかったこと~(ホラクラシーのメカニズム)
ホラクラシー型組織~実際に8年経営してわかったこと~(ホラクラシーのメカニズム)Kozo Takei
 
Y Combinator 創業者 Paul Graham からのスタートアップへのアドバイス(スタートアップが迷った時に読む Paul Graham から...
Y Combinator 創業者 Paul Graham からのスタートアップへのアドバイス(スタートアップが迷った時に読む Paul Graham から...Y Combinator 創業者 Paul Graham からのスタートアップへのアドバイス(スタートアップが迷った時に読む Paul Graham から...
Y Combinator 創業者 Paul Graham からのスタートアップへのアドバイス(スタートアップが迷った時に読む Paul Graham から...Takaaki Umada
 
AI Monetization Landascape in US
AI Monetization Landascape in USAI Monetization Landascape in US
AI Monetization Landascape in USOsaka University
 
企業文化をぶち壊すな / Startup Culture
企業文化をぶち壊すな / Startup Culture企業文化をぶち壊すな / Startup Culture
企業文化をぶち壊すな / Startup CultureTakaaki Umada
 
逆説のスタートアップ思考
逆説のスタートアップ思考逆説のスタートアップ思考
逆説のスタートアップ思考Takaaki Umada
 
Re: 逆説のスタートアップ思考 <七つの逆説>
Re: 逆説のスタートアップ思考 <七つの逆説>Re: 逆説のスタートアップ思考 <七つの逆説>
Re: 逆説のスタートアップ思考 <七つの逆説>Takaaki Umada
 
シリコンバレーの「何が」凄いのか
シリコンバレーの「何が」凄いのかシリコンバレーの「何が」凄いのか
シリコンバレーの「何が」凄いのかAtsushi Nakada
 

Destacado (13)

「採用学」に学ぶ、優秀な人材の育て方 先生:服部 泰宏
「採用学」に学ぶ、優秀な人材の育て方 先生:服部 泰宏「採用学」に学ぶ、優秀な人材の育て方 先生:服部 泰宏
「採用学」に学ぶ、優秀な人材の育て方 先生:服部 泰宏
 
ラフティング型人間のキャリア形成戦術Ver.2.1
ラフティング型人間のキャリア形成戦術Ver.2.1ラフティング型人間のキャリア形成戦術Ver.2.1
ラフティング型人間のキャリア形成戦術Ver.2.1
 
Yahoo! JAPAN 販促EXPO2015 宮坂学講演資料
Yahoo! JAPAN 販促EXPO2015 宮坂学講演資料Yahoo! JAPAN 販促EXPO2015 宮坂学講演資料
Yahoo! JAPAN 販促EXPO2015 宮坂学講演資料
 
データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)データ分析というお仕事のこれまでとこれから(HCMPL2014)
データ分析というお仕事のこれまでとこれから(HCMPL2014)
 
『プロフェッショナルとして生きるキャリア論 -10個のヒント-』
『プロフェッショナルとして生きるキャリア論 -10個のヒント-』『プロフェッショナルとして生きるキャリア論 -10個のヒント-』
『プロフェッショナルとして生きるキャリア論 -10個のヒント-』
 
ホラクラシー型組織~実際に8年経営してわかったこと~(ホラクラシーのメカニズム)
ホラクラシー型組織~実際に8年経営してわかったこと~(ホラクラシーのメカニズム)ホラクラシー型組織~実際に8年経営してわかったこと~(ホラクラシーのメカニズム)
ホラクラシー型組織~実際に8年経営してわかったこと~(ホラクラシーのメカニズム)
 
ビジネスモデルの作り方
ビジネスモデルの作り方ビジネスモデルの作り方
ビジネスモデルの作り方
 
Y Combinator 創業者 Paul Graham からのスタートアップへのアドバイス(スタートアップが迷った時に読む Paul Graham から...
Y Combinator 創業者 Paul Graham からのスタートアップへのアドバイス(スタートアップが迷った時に読む Paul Graham から...Y Combinator 創業者 Paul Graham からのスタートアップへのアドバイス(スタートアップが迷った時に読む Paul Graham から...
Y Combinator 創業者 Paul Graham からのスタートアップへのアドバイス(スタートアップが迷った時に読む Paul Graham から...
 
AI Monetization Landascape in US
AI Monetization Landascape in USAI Monetization Landascape in US
AI Monetization Landascape in US
 
企業文化をぶち壊すな / Startup Culture
企業文化をぶち壊すな / Startup Culture企業文化をぶち壊すな / Startup Culture
企業文化をぶち壊すな / Startup Culture
 
逆説のスタートアップ思考
逆説のスタートアップ思考逆説のスタートアップ思考
逆説のスタートアップ思考
 
Re: 逆説のスタートアップ思考 <七つの逆説>
Re: 逆説のスタートアップ思考 <七つの逆説>Re: 逆説のスタートアップ思考 <七つの逆説>
Re: 逆説のスタートアップ思考 <七つの逆説>
 
シリコンバレーの「何が」凄いのか
シリコンバレーの「何が」凄いのかシリコンバレーの「何が」凄いのか
シリコンバレーの「何が」凄いのか
 

Más de teapipin

卒業論文:ソフトウェアの価格決定方法とその価値 #卒論
卒業論文:ソフトウェアの価格決定方法とその価値 #卒論卒業論文:ソフトウェアの価格決定方法とその価値 #卒論
卒業論文:ソフトウェアの価格決定方法とその価値 #卒論teapipin
 
“本の虫”の自分が 『人を呼ぶ部屋』を作る難しさ
“本の虫”の自分が 『人を呼ぶ部屋』を作る難しさ“本の虫”の自分が 『人を呼ぶ部屋』を作る難しさ
“本の虫”の自分が 『人を呼ぶ部屋』を作る難しさteapipin
 
最近気になっているホーム&キッチンのグッズ5選
最近気になっているホーム&キッチンのグッズ5選最近気になっているホーム&キッチンのグッズ5選
最近気になっているホーム&キッチンのグッズ5選teapipin
 
スクショ撮るのに音が出るのはやめて欲しい
スクショ撮るのに音が出るのはやめて欲しいスクショ撮るのに音が出るのはやめて欲しい
スクショ撮るのに音が出るのはやめて欲しいteapipin
 
就職してからおよそ5ヵ月半
就職してからおよそ5ヵ月半就職してからおよそ5ヵ月半
就職してからおよそ5ヵ月半teapipin
 
就職して1ヶ月が経って
就職して1ヶ月が経って就職して1ヶ月が経って
就職して1ヶ月が経ってteapipin
 
明日は入社式(就職する前日)
明日は入社式(就職する前日)明日は入社式(就職する前日)
明日は入社式(就職する前日)teapipin
 
修士論文:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
修士論文:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論修士論文:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
修士論文:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論teapipin
 
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論teapipin
 
定番アルゴリズムを徹底理解!
定番アルゴリズムを徹底理解!定番アルゴリズムを徹底理解!
定番アルゴリズムを徹底理解!teapipin
 
「生命」と「情報」の関わりについて
「生命」と「情報」の関わりについて「生命」と「情報」の関わりについて
「生命」と「情報」の関わりについてteapipin
 
細胞間コミュニケーション(細胞の分子生物学 13章)
細胞間コミュニケーション(細胞の分子生物学 13章)細胞間コミュニケーション(細胞の分子生物学 13章)
細胞間コミュニケーション(細胞の分子生物学 13章)teapipin
 
修士研究:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
修士研究:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論修士研究:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
修士研究:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論teapipin
 
Comprehensive Analysis of Triplet Repeats in Vertebrate Genomes
Comprehensive Analysis of Triplet Repeats in Vertebrate GenomesComprehensive Analysis of Triplet Repeats in Vertebrate Genomes
Comprehensive Analysis of Triplet Repeats in Vertebrate Genomesteapipin
 

Más de teapipin (14)

卒業論文:ソフトウェアの価格決定方法とその価値 #卒論
卒業論文:ソフトウェアの価格決定方法とその価値 #卒論卒業論文:ソフトウェアの価格決定方法とその価値 #卒論
卒業論文:ソフトウェアの価格決定方法とその価値 #卒論
 
“本の虫”の自分が 『人を呼ぶ部屋』を作る難しさ
“本の虫”の自分が 『人を呼ぶ部屋』を作る難しさ“本の虫”の自分が 『人を呼ぶ部屋』を作る難しさ
“本の虫”の自分が 『人を呼ぶ部屋』を作る難しさ
 
最近気になっているホーム&キッチンのグッズ5選
最近気になっているホーム&キッチンのグッズ5選最近気になっているホーム&キッチンのグッズ5選
最近気になっているホーム&キッチンのグッズ5選
 
スクショ撮るのに音が出るのはやめて欲しい
スクショ撮るのに音が出るのはやめて欲しいスクショ撮るのに音が出るのはやめて欲しい
スクショ撮るのに音が出るのはやめて欲しい
 
就職してからおよそ5ヵ月半
就職してからおよそ5ヵ月半就職してからおよそ5ヵ月半
就職してからおよそ5ヵ月半
 
就職して1ヶ月が経って
就職して1ヶ月が経って就職して1ヶ月が経って
就職して1ヶ月が経って
 
明日は入社式(就職する前日)
明日は入社式(就職する前日)明日は入社式(就職する前日)
明日は入社式(就職する前日)
 
修士論文:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
修士論文:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論修士論文:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
修士論文:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
 
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
卒業論文:小胞体モデル異常タンパク質△proに対するO型糖鎖付加の試験管内再構成 #卒論
 
定番アルゴリズムを徹底理解!
定番アルゴリズムを徹底理解!定番アルゴリズムを徹底理解!
定番アルゴリズムを徹底理解!
 
「生命」と「情報」の関わりについて
「生命」と「情報」の関わりについて「生命」と「情報」の関わりについて
「生命」と「情報」の関わりについて
 
細胞間コミュニケーション(細胞の分子生物学 13章)
細胞間コミュニケーション(細胞の分子生物学 13章)細胞間コミュニケーション(細胞の分子生物学 13章)
細胞間コミュニケーション(細胞の分子生物学 13章)
 
修士研究:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
修士研究:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論修士研究:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
修士研究:ヒト、チンパンジー、マウスにおけるトリプレットリピートの網羅的解析 #修論
 
Comprehensive Analysis of Triplet Repeats in Vertebrate Genomes
Comprehensive Analysis of Triplet Repeats in Vertebrate GenomesComprehensive Analysis of Triplet Repeats in Vertebrate Genomes
Comprehensive Analysis of Triplet Repeats in Vertebrate Genomes
 

ツイッター調査:約173万ツイートを調査して分かったTwitterの利用動向 #twtr_hack

  • 1. 約173万ツイートを調査して分かった Twitterの利用動向 @teapipin 2012.08.01 Twitter 勉強会 #twtr_hack
  • 2. 自己紹介 • HN :てぃー • ID:@teapipin • 本名:Shigeo Okada • ブログ:creativi.tea (クリエイティビティ) • 趣味でアプリ開発
  • 3. 自己紹介 • HN :てぃー • ID:@teapipin • 本名:Shigeo Okada • ブログ:creativi.tea (クリエイティビティ) • 趣味でアプリ開発
  • 4. 自己紹介 • HN :てぃー • ID:@teapipin • 本名:Shigeo Okada • ブログ:creativi.tea (クリエイティビティ) • 趣味でアプリ開発
  • 5. • iPhoneアプリ 年齢計算★ 学歴欄作成 e-スペル (公開停止中) (暗記用アプリ) • Macアプリ (Vectorにて) Interval Timer EX デジカメ撮影日を デジカメ変更日を撮影日に (インターバルタイマーEX) 一括変更 for Mac 一括変更 for Mac
  • 6. 自己紹介 • 学生時代:コンピュータによる遺伝子解析 – 使用言語:Perl • PG/SE時代:集計システムの開発 – 使用言語:Visual Basic、VBA • 現在:経済系の大学
  • 7. 今日のテーマ • Twitterの利用動向を知るために 約173万ツイートを調査したので報告 • ブログで13の記事に分けて紹介したものを補足 – ツイート数、はてブ数、いいね数、検索数が多かった 記事の内容をピックアップ – ブログでは省略した説明も – ブログに未掲載の情報も(後日ブログに追記予定) • クライアントの開発に活用
  • 8. 事の発端 • Twitterのアプリやサービスを作ってみたいなぁ • 特に位置情報を使った情報の広がりをテーマにし てみたいなぁ じゃあ、 – どんなTwitterクライアントが人気あるんだろう? – 位置情報からどの地域のツイートが多いんだろう? など全体を調査したものを検索して探してみたら・・・
  • 11. あったのは、 • 海外の調査 – 日本の動向とは違うはず • ユーザへのアンケート集計 – 偏りあり。無意識で行っていることは分からない • 指定ユーザの統計(ウェブサービス) – 全体の動向が分からない • 古いデータ(~2010年頃) – 今の動向とは違うはず • サンプル数が少ない – 一般化できない • 細かく分類されていない – 調べたい組み合わせがなかったりする
  • 12. ないなら自分で調べてみることに • 「Twitter API ポケットリファレンス」 • @yusukeさん著 • 理解しやすい本 • Twitter4Jは直感的で分かりやすく、 すぐに調査に入れた
  • 14. ツイートの取得方法 • Twitter4JでStreaming APIのsampleを使用 – 公開ツイートのうち約1%データが取得できる – 注意:複数接続しても同じデータしか取得できない • 次の情報を取得 – タイムゾーン :getTimeZone() – 位置情報 :getGeoLocation() – 日時 :getCreatedAt() – クライアント :getSource() – ユーザID :getScreenName() – ツイート :getText() – 公式リツイートか否か :isRetweet()
  • 15. 日本語のみのツイートを選別 • タイムゾーンからでは判断できない – nullや(なぜか)Hawaii、 Irkutsk(イルクーツク:ロシア領)が多い • getLang(言語設定の取得)でも判断できない – 例) ”en”でも日本語のツイート、”jp”でも英語のツイートあり • ツイートが日本語かで判断した – 1文字ごとにCharacter.UnicodeBlockで判定 – 詳細は http://teapipin.blog10.fc2.com/blog-entry-281.html – 実際はこれでも中国語やアラビア語?などがあった – 情報処理学会などの論文では「ひらがな・カタカナ」を含むも ののみを取得していることが多い。しかしこれでは記号の み、顔文字のみが取得できない – 結局最後は手作業で判断(約2万ツイート除去)
  • 17. 取得データ • 期間: 2012/05/17(木)0:00 ~ 20(日)23:59 の4日間 • ツイート数: 172万5212 ツイート(日本語のみ) • ユーザ数: 92万6150 ユーザ
  • 20. ビッグイベント • 21(月)金環日食 • 22(火)東京スカイツリー開業 • ビッグイベントでは通常とは傾向が異なるため 除外 • 月~水曜の傾向は木曜で代替できると仮定
  • 21. 紹介する調査結果 • Twitterクライアント(アプリ、サービス) • 曜日別・時間帯別 • ツイートの種類別 • 機器別 • 位置情報 • 他はブログに
  • 22. 紹介する調査結果 • Twitterクライアント(アプリ、サービス) • 曜日別・時間帯別 • ツイートの種類別 • 機器別 • 位置情報
  • 23. Twitterクライアント(アプリ、サービス) 順位 利用アプリ名 個数 割合(%) 順位 利用アプリ名 個数 割合(%) 1位 Twitter for iPhone 251,414 14.57% 31位 TweetCaster for Android 6,062 0.35% 2位 3位 Twitter for Android web 209,290 180,538 12.13% 10.46% 32位 33位 HootSuite ShootingStar 5,930 0.34% 5,771 0.33% • すべてで 4位 5位 Keitai Web twittbot.net 131,918 100,952 7.65% 5.85% 34位 35位 OpenTween Tweet ATOK 5,516 0.32% 5,341 0.31% 1万5108種類 6位 twicca 93,542 5.42% 36位 ついっぷる Pro for iPhone 5,005 0.29% 7位 ついっぷる/twipple 63,854 3.70% 37位 TwitBird 4,962 0.29% 8位 9位 Janetter SOICHA 47,559 43,759 2.76% 2.54% 38位 39位 ツイ助。 Twitter for iPad 4,772 0.28% 4,749 0.28% • 上位4位は公式 10位 Echofon 39,672 2.30% 40位 mixi ボイス 4,093 0.24% 11位 Tween 33,583 1.95% 41位 Twil2 3,860 0.22% 12位 ついっぷる for iPhone 24,391 1.41% 42位 Tweetlogix 3,630 0.21% 13位 14位 TweetDeck jigtwi 22,597 21,987 1.31% 1.27% 43位 44位 Seesmic Instagram 3,626 0.21% 3,622 0.21% • それぞれ機能 15位 モバツイ / www.movatwi.jp 18,030 1.05% 45位 ニコニコ動画 3,565 0.21% が異なる 16位 Twipple for Android 17,759 1.03% 46位 BotMaker 3,503 0.20% 17位 ついっぷる for iPhone 16,749 0.97% 47位 jigtwi for Android 3,425 0.20% 18位 Mobile Web 16,175 0.94% 48位 Krile2 3,379 0.20% 19位 20位 Tweet Button Tweetbot for iOS 16,001 15,535 0.93% 0.90% 49位 50位 Twitter for BlackBerry foursquare 3,232 0.19% 2,951 0.17% • Javaのものは 21位 22位 Saezuri 12,412 モバツイ / www.movatwi.jp . 12,360 0.72% 0.72% 51位 52位 TwitCasting Teewee 2,776 0.16% 2,522 0.15% Twitter4Jを使っ 23位 24位 yubitter Twipple for Android 11,590 10,154 0.67% 0.59% 53位 54位 Ustream.TV Twitter for Mac 2,337 0.14% 2,323 0.13% ているものが多 25位 YoruFukurou 10,056 0.58% 55位 TweetList Pro 2,300 0.13% い 26位 ツイタマ 9,419 0.55% 56位 twitbeam[ツイットビーム] 2,240 0.13% 27位 TweetList! 8,920 0.52% 57位 Twipple Pro for Android 2,164 0.13% 28位 EasyBotter 8,893 0.52% 58位 PlayStation Vita 2,030 0.12% 29位 twitterfeed 6,590 0.38% 59位 Google 1,983 0.11% 30位 dlvr.it 6,283 0.36%
  • 24. Twitterクライアント別のツイート数 300,000 100% 90% 250,000 80% 70% 200,000 個数 60% 累積(%) 累 個 150,000 50%積 数 ( % 40%) 100,000 30% 20% 50,000 10% 0 0% 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 順位
  • 25. Twitterクライアント別のツイート数 300,000 100% 90% 250,000 80% 70% 200,000 個数 60% 累積(%) 累 個 150,000 50%積 数 ( % 40%) 100,000 30% 20% 50,000 10% 0 0% 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 • 上位5位で約50%を占める寡占市場順位 • 60位以下が約10%を1万5049種類が占める長いロングテール
  • 26. ここまでのまとめ • 上位1~4位は公式が占めている • 上位5位で約50%を占める寡占市場 • 長いロングテール(文字どおりの意味での) • ユーザは用途別に複数のTwitterクライアントを 使い分けている • 新規参入は容易で、ユーザのニーズを捉えれば 必ず使ってもらえる
  • 27. 紹介する調査結果 • Twitterクライアント(アプリ、サービス) • 曜日別・時間帯別 • ツイートの種類別 • 機器別 • 位置情報
  • 29. 海外との比較 • 2009年 全世界の2000万ツイート 月 火 水 木 金 土 日 出典:Sysomos Inc. http://www.sysomos.com/insidetwitter/
  • 34. 紹介する調査結果 • Twitterクライアント(アプリ、サービス) • 曜日別・時間帯別 • ツイートの種類別 • 機器別 • 位置情報
  • 35. ツイートの種類別 • リツイート(公式RT、非公式RT) • リプライ・メンション(宛先(@~)を含むもの) • ハッシュシュタグ・リンク入りつぶやき (RT、リプライ・メンションを除く) • 純粋なつぶやき
  • 36. ツイートの種類別 ハッシュタグ・ 公式RT リンク入りつ 7.92% 非公式RT ぶやき 2.30% 17.01% リプライ・メン ション 37.00% 純粋なつぶ やき 35.77% リプライ・メンションは宛先(@~)を含むもの ハッシュタグ・リンク入りはRT、リプライ・メンションを除く • リツイートは公式・非公式合わせて10.23%
  • 37. ツイートの種類別 ハッシュタグ・ 公式RT リンク入りつ 7.92% 非公式RT ぶやき 2.30% 17.01% リプライ・メン ション 37.00% 純粋なつぶ やき 35.77% リプライ・メンションは宛先(@~)を含むもの ハッシュタグ・リンク入りはRT、リプライ・メンションを除く • 純粋なつぶやき以外はコミュニケーションとしてのやり とりであり、64.23%を占める
  • 38. ここまでのまとめ • ツイッターは人とのコミュニケーションのツー ル • ツイッター本来の目的である純粋なつぶやき は35.77%
  • 39. 紹介する調査結果 • Twitterクライアント(アプリ、サービス) • 曜日別・時間帯別 • ツイートの種類別 • 機器別 • 位置情報
  • 40. 機器別 • Twitterクライアントでの上位59位(90.98%)を 5つに分類 PC/携帯, WEB, 2.3% 4.0% bot, 8.0% PC, 23.9% 携帯, 61.9%
  • 43. 紹介する調査結果 • Twitterクライアント(アプリ、サービス) • 曜日別・時間帯別 • ツイートの種類別 • 機器別 • 位置情報
  • 44. 位置情報(Geo Location) 位置情報付き うち日本 うち外国 位置情報なし 木 0.16% 0.15% 0.01% 99.84% 金 0.16% 0.16% 0.01% 99.84% 土 0.22% 0.21% 0.01% 99.78% 日 0.19% 0.18% 0.01% 99.81% 計 0.18% 0.18% 0.01% 99.82% ※位置情報の付いたもののみ (地図へのリンクのみは除く) • 全体でたったの0.18%しか付与されていない • 日本のものは3047ツイート、外国のものは144ツイート • 次のスライドからはすべて日本のもののみの結果
  • 45. 位置情報付きTwitterクライアント 順位 全体 名称 個数 割合(%) 1位 50位 foursquare 1086 39.49% • すべてで140種類 2位 1位 Twitter for iPhone 651 23.67% 3位 2位 Twitter for Android 359 13.05% 4位 44位 Instagram 171 6.22% 5位 6位 97位 18位 ロケタッチ(loctouch) Mobile Web 163 54 5.93% 1.96% • 位置情報サービス 7位 173位 Path 2.0 33 1.20% が約47%以上 8位 641位 RADIO WAVE API 26 0.95% 9位 768位 FU-TOWN 25 0.91% 10位 430位 今ココなう!iPhone 23 0.84% 11位 11位 6位 1002位 twicca AgenaStar 20 20 0.73% 0.73% • 2、3位は公式 13位 1062位 FutownNewsVer5 19 0.69% 13位 314位 今ココなう!Android 19 0.69% 15位 458位 モバイルフォースクエア 16 0.58% 16位 1218位 SyougaSuite 15 0.55% • 店舗情報、天気など 16位 1371位 FutownEvent 15 0.55% 18位 86位 Photos on iOS 12 0.44% その地点の情報を 18位 20位 1736位 31位 cpSTYLE(クーポンスタイル) TweetCaster for Android 12 11 0.44% 0.40% 知らせるものもある
  • 46. 木曜 位置情報付きTwitterクライアント別 60 50 その他 ロケタッチ 40 (loctouch) Instagram 30 Twitter for Android 20 Twitter for iPhone 10 foursquare 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 時間帯 • どの曜日も似た傾向 • 朝~夕方はfoursquareの増減が全体に影響 • 夜は公式とその他が影響
  • 47. 都道府県別 • 大都市やその 隣接地域で多い • 人口と関係が ありそう
  • 48. 人口との相関 • 正の相関
  • 49. ここまでのまとめ • 人口が多い地域ほど、 位置情報の付いたツイート数 も多い • 人口が多いのだからツイート数が多いのは当たり前と 考えてよいのか? • それは違う! • わざわざ位置情報を付けているのは普通のツイートと は異なる何か特別な意味があると考えるべき • にもかかわらず、人口と相関が強いのはなぜか? 位置情報付きのツイートの内容を見る必要がある
  • 50. 位置情報とツイート内容の関係 • 位置情報付きツイートの内容からツイート自体 が位置を意識したものかで分類 • (例) 位置情報 ツイート 分類 レストラン おいしい → 飲食店 レストラン あらら → 関係なし レストラン (店舗情報) → 地点
  • 51. 位置情報とツイート内容の関係 順位 場所 個数 割合 1位 2位 関係なし 駅 1021 379 33.51% 12.44% • 関係なしが33.51%を占め 3位 飲食店 347 11.39% る 4位 商業施設 344 11.29% 5位 地点 212 6.96% 6位 道路 155 5.09% 7位 8位 イベント会場 コンビニ 69 53 2.26% 1.74% • 駅、飲食店、商業施設な 9位 学校 52 1.71% ど日常使う場所からのツ 10位 スポーツ施設 45 1.48% 11位 自宅 42 1.38% イートが多い 12位 公園 40 1.31% 13位 オフィス 36 1.18% 14位 空港 24 0.79% 15位 テーマパーク 23 0.75% • イベント会場、テーマパー 16位 宿泊施設 20 0.66% 17位 寺社 19 0.62% クなどイベント、観光地か 17位 公共施設 19 0.62% らもある 19位 バス停 16 0.53% 20位 博物館・美術館 15 0.49%
  • 52. 都道府県(上位)別 位置情報とツイート内容の関係 250 200 150 東京都 神奈川県 100 大阪府 愛知県 埼玉県 千葉県 50 0 関 駅 飲 商 地 道 イ コ 学 ス 自 公 オ 空 テ 宿 寺 公 バ 博 係 食 業 点 路 ベ ン 校 ポ 宅 園 フ 港 ー 泊 社 共 ス 物 な 店 施 ン ビ ー ィ マ 施 施 停 館 し 設 ト ニ ツ ス パ 設 設 ・ 会 施 ー 美 場 設 ク 術 館
  • 53. 木曜 位置情報とツイート内容の関係 70 60 その他 その他イベント関係 50 スポーツ施設 学校 40 コンビニ イベント会場 30 道路 地点 20 商業施設 飲食店 10 駅 関係なし 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 時間帯 • 木曜・金曜は似た傾向 • 上位のものが大部分を占める • 朝は駅、昼は飲食店、夜は関係なし、深夜は地点が多い
  • 54. 日曜 位置情報とツイート内容の関係 70 60 その他 その他イベント関係 50 スポーツ施設 学校 40 コンビニ イベント会場 30 道路 地点 20 商業施設 飲食店 10 駅 関係なし 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 時間帯 • 土曜・日曜は似た傾向 • 駅は9時以降増加、商業施設・道路が多い • イベント関係は午前に多い
  • 55. ここまでのまとめ • 位置情報と関係のない内容のツイートが1位 – ユーザはツイートに位置情報が付いていることに気付い てない? – 特別な時に位置情報を付けるのではなく、ふだんから付 けている • 駅 、飲食店、商業施設など日常使う場所からのツ イートが多く、ライフログ・ポイント取得としての性格が 強い • 位置情報付きでも人口の多い都市圏のツイートが多く なる • イベントや観光地からのツイートはあるが、少ないた め埋もれている
  • 56. 参考 書籍 • 「Twitter API ポケットリファレンス」 • 「Rによるデータサイエンス - データ解析の基礎から最 新手法まで」 フリーソフト、サービス • Twitter4J • Pleiades All in One (Eclipse + Java) • R (統計ソフト) • MANDARA (地図ソフト) • usoinfo reverse geocoder (緯度経度→住所変換) • Google マップ
  • 57. (質問と回答) #twtr_hack #qに対して • sampleでデータとり続けて、1日でだいたいどれくらいの データ量(ディスクに保存して何MBとか)になるんですか? – TSV(タブ区切り)形式で、木・金曜:約74MB、土曜:約76MB、日 曜:約84MB • botとそうでないのは "from" を見て区別? • botの区別は確かにどうやるのでしょう – 取得データのSource(クライアント)から判断しました。 "from"と同義です • 場所についてはツイート内容から判断?実際の場所にどん なものがあるか(地図とか)は調べてない? – GeoLocationの緯度経度から地図を見て実際に何があるかを調 べました
  • 58. (付録) • 以下のスライドは当初の案では発表予定だっ たけど時間の都合上使わなかったもの
  • 59. Twitter APIの仕様上の限界 • 閲覧数(ROM数)は分からない • リンク先に移動したかどうか分からない • sampleで取得できる約1%の意味が曖昧 など
  • 60. 海外との比較 • 2009年 全世界の2000万ツイート 当時は、 • アメリカ 62.14% • 日本 11位(0.71%) • 事実上、欧米の調査 出典:Sysomos Inc. http://www.sysomos.com/insidetwitter/
  • 61. 機器別・曜日別のツイート数の割合(%) 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% 3.97% 木 62.45% 23.04% 8.25% 2.29% 3.99% 携帯 金 62.22% 23.07% 8.45% PC 2.27% PC/携帯 3.99% WEB bot 土 61.60% 24.05% 8.12% 2.25% 3.92% 日 61.29% 25.10% 7.43% 2.26% • どの曜日もほぼ同じ割合
  • 62. 寄与度(%)とは • GDP(国内総生産)などの経済分野での時系列分 析でよく使われる手法 • あるデータ全体の変化に対してその構成要素であ る個々のデータの変化がどのように貢献している かを示す指標 • HPやブログのアクセス解析でも有効な手法 • ここでは基準を木曜に <日曜の携帯機器の場合> (日曜の携帯機器-木曜の携帯機器) × 100 木曜の計
  • 64. 紹介する調査結果 • Twitterクライアント(アプリ、サービス) • 曜日別・時間帯別 • ツイートの種類別 • 機器別 • 文字数 • 位置情報
  • 65. 多い文字(本文のみ) 順位 ツイート 個数 順位 ツイート 個数 1位 おはようございます 289 16位 おはようございます! 85 2位 おはよー 261 17位 おはよ 83 3位 ただいまー 251 18位 離脱 77 4位 おはよう 214 19位 むくり 76 5位 ただいま 189 20位 おなかすいた 75 6位 おやすみ 176 21位 ほかいまー 73 7位 おやすみなさい 174 22位 あー 69 8位 眠い 161 23位 (´へωへ`*) 68 9位 ねむい 152 24位 ただいま! 61 10位 おはようございます。 147 24位 ただいまー! 61 11位 あ 129 26位 !? 60 12位 よるほー 125 27位 はい 59 13位 帰宅 116 28位 寝る 56 14位 おやすみー 90 29位 疲れた 54 15位 ねむ 87 30位 おやすみなさい。 53 • 挨拶と感情が大半を占める • 状況を表すものも多い
  • 67. 25% 50% 25% • 平均43.5文字 • 140文字が最も多い (うち、公式RT:80.0%、非公式RT:5.0%) • 20~57文字が50%を占める
  • 68. 25% 50% 25% • 平均43.5文字 • 140文字が最も多い (うち、公式RT:80.0%、非公式RT:5.0%) • 20~57文字が50%を占める
  • 69. Twitterクライアント別の平均文字数(上位30位) 0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 twitterfeed Twitter for BlackBerry ツイ助。 Tweet Button Google dlvr.it ニコニコ動画 Ustream.TV HootSuite foursquare BotMaker TwitCasting EasyBotter Twitter for Mac Twitter for iPad web Twipple for Android ついっぷる Pro for iPhone ついっぷる/twipple TweetCaster for Android ついっぷる for iPhone TwitBird Twipple for Android Seesmic Twipple Pro for Android ついっぷる for iPhone twittbot.net Instagram Mobile Web モバツイ / www.movatwi.jp
  • 70. 箱ひげ図とは 25% 50% 25% 中央値(平均値ではない) 外れ値(異常値)
  • 71. 箱ひげ図とは 25% 50% 25% 中央値(平均値ではない) 外れ値(異常値) ヒストグラムと対応
  • 73. ここまでのまとめ • PC、携帯機器からとも20~60文字ほどが最も 多く50%を占める • PC 、携帯機器からで文字数に差は見られない • 昔のように「ケータイのメールは短く、詳細は PCで」ということはない • botからは定型文が多いため、文字数の幅は 少ない
  • 74. 木曜 位置情報付きツイート 位 置 全 情 体 報 • 木曜・金曜では朝から夕方までは全体の増減に伴って 増減、夜からは全体の増減に伴わない
  • 75. 日曜 位置情報付きツイート 位 置 全 情 体 報 • 土曜・日曜では朝から昼くらいまでは全体の増減に 伴って増減、他の時間帯ではそうでもない