dat.blog
dat
dat
nxdataka

データ分析の世界に惹かれて30代で分析会社に転職。数学・統計学・機械学習・プログラミングと色々苦しみ&楽しみながら勉強中

コマンドライン引数(sys.argv,argparse)についての覚え書き

これは何? 先日、livedoorニュースコーパスをcsvファイル形式で取得するという記事で公開するスクリプトを書いた。 それに加え、最近ちょくちょくモジュールを自作する機会があり、それらの経験を通して学んだコマンドライン引数(sys.argv,argparse)についての覚え書き。 簡単に使えるsys.argv はとにかく簡単に使える。標準ライブラリのをインポートしてしてを呼ぶと、実行ファイルパスとコマンドライン引数をリスト型で受け取れる。 たとえば、以下のようなpython…

WSL側のPythonでpipenv installが失敗する症状への対処法

これは何? WSL(windows subsystem for linux)でpipenv installが失敗する症状への対処方法。 たまに遭遇し、忘れて調べ直すことが多いので書いておく。ちなみにWSL1での症状。 症状 こんな感じでOSErrorが出る。 と、Windows側のWindowsAppsディレクトリにあるpython.exeが呼ばれてしまって失敗している。 対処法 windowsスタートメニュー>設定>アプリ>アプリ実行エイリアス>アプリインストーラーのpython.exeを(念の為python3.exeも)オフにする。 対策後はpipenv install…

loggingについての覚え書き

これは何? 先日、livedoorニュースコーパスをcsvファイル形式で取得するという記事で公開するスクリプトを書いた。 それに加え、最近ちょくちょくモジュールを自作する機会があり、それらの経験を通して学んだloggingについての覚え書き。 loggingを使うモチベーション 開発者側のモチベーション: メンテナンスを考えてコードがちゃんと動いているか、問題があるとすればどこで問題が発生したかを追跡したい。 ユーザー側のモチベーション: 実行結果のログをファイル出力したり、煩わしいログ表示をオフにしたりしたい。 このあたりの要望に応えるのが標準ライブラリのlogging…

livedoorニュースコーパスをcsvファイル形式で取得する

これは何? 自然言語処理を日本語で色々試してみよう、ってときに、手軽に使える言語資源を用意するのって中々に大変ですよね。 今回はlivedoorニュースコーパスを取得し、取り回しのしやすいcsvファイル形式(表形式)に変換するスクリプトを作ったので公開します。 記事のURL、日時、タイトル、本文、配信元が列になったcsvファイルの言語資源がほしい、って人はぜひ使ってください。 変換後のcsvはたとえばPythonで使うなら、こんな感じ↓にpandas.read_csvで読み込めます。 使い方 gistでlivedoorニュースコーパスをcsvファイル形式で取得するPython…