読者です 読者をやめる 読者になる 読者になる

twitterのテキストデータからurl、メンション、改行を抜くShell Script

twitterのテキストデータからurl、メンション、改行を抜くShell Scriptを書きました。

#!/bin/bash 
sed -e 's/\(RT \)*@.\+[ :]//g' -e 's/\/*[http|t].*//g' -e 's/\\n//g' -e '/^ *$/d' $1

大量のデータから雑に消すことを想定しているので、urlが含まれているツイートのurl後の文章を全消ししたりしています。不便があったら改良するかもしれません。