全ツイートログから抽出してcsvに保存

前提:気が向いたら体重をツイートしておく。基本は「XX.X kg」形式。

# -*- coding: utf-8 -*-
# 
import json
import re
from datetime import datetime
#全ツイートファイルを読みこむ
with open(r"C:\twitter-2020-03-07/tweet.js", 'r', encoding="utf-8_sig") as f:
data = f.read()
f.close
#jsonに変換
tw = json.loads(data[data.find('[') :])
#出力用csvファイル作成(上書き)
with open(r"C:\twitter-2020-03-07/体重.csv", 'w', encoding="utf-8_sig") as h:
#全ノードループ
for t in tw:
#フルテキストの中から体重部分を検索
r = re.search(r'[\d ]+\.[\d ]+kg', t["tweet"]["full_text"])
if r:
#見つかったら
#日付取得
tweet_datetime = datetime.strptime(t["tweet"]["created_at"], '%a %b %d %H:%M:%S %z %Y')
#数字部分抽出
hh = r.group(0)[: len(r.group(0)) - 2]
#kgを削除して書き込み
h.writelines(tweet_datetime.strftime('%Y/%m/%d') + "," + hh + "," + "\n")
h.close

出力

f:id:elve:20200307124323p:plain

エクセルで簡単にグラフにできる\(^o^)/
f:id:elve:20200307124622p:plain

どのくらい面白かった?

星を押して送信してね

平均 0 / 5. Vote count: 0

是非フォローしてください

最新の情報をお伝えします

コメントする

メールアドレスが公開されることはありません。 が付いている欄は必須項目です