Comma Separated Value の略。
主に表計算ソフト間の互換フォーマットとして用いられる。「カンマでカラムが区切られ、改行で行が区切られる」という漠然としたルールで明確なフォーマットの仕様や標準は存在しなかったが、2005年10月にCSVの仕様について書かれたRFC 4180が公開された。
また、タブ区切りなどもCSVに含める場合がある。これは "Character-Separated Values" の略である。
バージョン管理システムのCVSと間違いやすい。
データクリーニング・前処理におけるピットフォールとして 『CSVファイルをExcelで開くと文字化けする』 があります。 これスモールデータならExcelでCSVファイルの中身を眺めることが気が付くことができるかもしれませんが、大きなデータでは文字化けしていることに気が付けない可能性があります。(そもそも大きなデータをExcelで開くこと自体が重さ・効率の面で好ましいとは言えなさそうなのですが) なので以下の問題が発生することに注意が必要です: CSVファイルをExcelで開く→文字化けする→気が付かずに上書き保存する→文字化けしたデータで解析を進めてしまう やはりデータは統計ソフト(RやST…
pythonのpandasでcsvを開いて、条件を満たす行に加工をする + ある行をファイル末尾にコピーして追記したいpandasというのを使うのは初めてだった ・勝手にindexという列ができていたり、そのindexは加工不可だったりで色々と大変だった・・・ ・astropyの単位みたいに、printしたら勝手にヘッダーにあるkeyも表示されてたりしてその対処が必要 ・ある列、ある行の要素を取り出すのに、リストみたいに通し番号で指定できるのかと思ったらそれはできなかった・・・ ilocといかいうのを使う必要がある import pandas as pd df = pd.read_csv('h…
こんにちは! IT業界に努めて5年のなんちゃってエンジニアです。 入社した当初にExcelの使い方などの研修を受けて、独学でVBAマクロを学習してきました。今まで使ってきたコード残しておきたいので記事にすることにしました。 もしよかったらご自由にお使いください。 ※dim 変数を定義 as データ型を定義 セル入力内容の転記 セルA1の内容をB2へ転記: ActiveSheet.Range("A1").Value = ActiveSheet.Range("B1").Value ActiveSheet.Cells(1, 1).Value = ActiveSheet.Cells(1, 2).Val…
# 本文 。、こんにちは、きょうは、ExcelやGoogle spreadsheetなどの表計算ソフトについてお話したいと思います。これら表計算ソフトで、A列を空列にしたものをよくみかけます。 。やめましょう。 きちんと先頭からデータを入力します。 ふつう、句読点を頭に配置するなんてことはしないでしょう。A列や1行を空列にするということは、句読点を頭に配置しているようなものです。やめましょう。見た目として余白のために全く不要である空列空行を入力したくなる気持ちは分からなくないですが、空列空行を入力するとデータとして汚くなります。
この記事に書いてあること タイトルの通り、Node.jsでcsv-parseを使ってcsvファイルを読み込む実装を紹介します。 Node.jsにはcsvファイルを読み込むライブラリが複数ありますが、おそらく一番人気っぽいcsv-parseを使ってみました。 csv vs csv-parse vs csv-parser vs fast-csv | npm trends ちゃんとTypeScriptにも対応しています。 この記事での実装の全体はGitHubに置きました。 よければ参照してください。
「CSVファイルをExcelで開いたら、先頭の0が落ちてしまったけど、どうやって対処したらいいかわからない・・・」 ExcelでCSVファイルを開いた時に先頭の0が落ちてしまって困った経験をお持ちの方は多いでしょう。 本記事はそんな方に向けた、CSVファイルの値の先頭が0落ちしてしまった時の解決方法について解説する記事です。 0落ちを発生させないようにする方法や、なぜ0落ちが発生するのか、上書き保存してしまった時の対処法などについてお話ししますので、ファイル編集作業の参考としてください。 それではご説明させていただきます。 そもそもなんでCSVファイルは0落ちするのか? ExcelでCSVファ…
本記事は、PowerShellを利用しActiveDirectoryのユーザーのセキュリティグループをCSVで一括作成するスクリプトのサンプルです。 統合アカウント管理ソリューション的なものを持っていない企業や自治体の情シスの方は、基本AD上で手作業によるユーザー作成やセキュリティグループの変更を行っていることと思います。 このスクリプトを使用すると、手作業で行っているユーザー編集のムラを無くし、短時間で効率的にADユーザーのセキュリティグループを変更することができます。 セキュリティグループのほか、ログオンスクリプト等も合わせて設定を行う仕様になっておりますので、必要に応じてカスタマイズする…
本記事は、PowerShellを利用してActiveDirectoryのユーザーをCSVで一括作成するスクリプトに利用するためのCSVを、ExcelVBAで生成する方法について解説する記事です。 ★PowerShellのスクリプトに関しての記事はこちら www.withdrawal-civilservice.com 上のリンクの記事と合わせて利用することで、AD管理が大幅に効率化されます。 また、単にExcelVBAでCSVを作成するためのソースコードとして転用することも可能ですので、用途に合わせてご活用ください。 それではご説明させていただきます。 必要なExcelの構成 入力用 所属コード…
この記事に書いてあること csvファイルをコマンドを使って、特定の列を条件にソートする方法をメモしておきます。 ヘッダもソート結果のファイルに移動します。 $ (head -n 1 test.csv && tail -n +2 test.csv | sort -t , -k 3) > test_sort.csv 上のコマンドによって、 test.csvの先頭行をヘッダとして扱って出力先ファイルにもヘッダとして書き出し、 2行目以降からファイル末尾までを区切り文字をカンマとして3列目をキーとしてソートしてファイルに出力します。
VAddyで、クロールしたURLの一覧情報のCSVダウンロード、発見した脆弱性情報のCSVダウンロード機能をリリースしました。 クロールしたURLの一覧情報のCSVダウンロード クロールしたURL一覧は画面上で表示できていましたが、この情報をCSVダウンロードしてサイトマップと付き合わせることで、VAddyの検査カバー範囲を確認したいというご要望を受け、本機能をリリースしました。 クロール管理の該当クロールデータを選択するとクロールしたURLの一覧が表示されます。その画面の右上にある「クロールURLダウンロード(CSV)」ボタンを押下するとダウンロードできます。 本機能はエンタープライズプラン…
はじめに この記事は freee Developers Advent Calendar 2024 - Adventar 12/14(14日目)の記事です。 adventar.org こんにちは。freeeで機械学習エンジニアをしているmickyです。 普段はAI-LabというチームでOCR開発のリードをしています。 今回はOCRチームで今期にかけて開発したクレジットカード明細OCRについて概要と技術的なチャンレンジについて紹介します。 このクレジットカード明細OCRはfreeeのデータ化サービスの内部プロダクトに搭載され、実業務で使用される予定です。 freeeのデータ化について freeeデ…
こんにちは、インフラグループの片桐です。 この記事はEnigmo Advent Calendar 2024の 14 日目の記事として、サーバ機器管理台帳を表計算ツールから OSSの「NetBox」に移行した取り組みについて紹介します。 はじめに サーバ機器やネットワーク機器、各機器に付随するIPアドレスの情報など、サーバ機器や関連情報をまとめる為に「機器管理台帳」は欠かせないものになっています。その中で、機器管理台帳はExcelやGoogle スプレッドシート等の表計算ツールで管理されているケースもよく見られます。 表計算ツールを台帳として機器管理している場合、台帳の規模が拡大するにつれて、管…
この記事は「マイクロマウス Advent Calendar 2024」 14日目の記事です。 昨日はmhrさんがスラローム設計、2枚目の方もKojimouseさんが補足を....あれ...?(12/13 20:20時点ではまだですね・・・) 中部支部大会で前振りしていたとはいえ、突然メールをぶん投げたのに、登録していただけただけでも感謝です。 私のスラロームは大学を卒業する2014年度大会の頃にMiceで流行ったものをずっと使っています。 今日の記事でもその補助ツールが名前だけですが登場します。 導入 「ESP32使いとのことですが開発環境などはどうされていますか?」 という質問に応える形で、…
表形式のデータをAIに読み込ませて分析することで、これまで人が行っていたデータ処理を自動化し、より高度な分析が可能になります。 なぜAIによる表データの分析が注目されているのか? 時間短縮: 大量のデータを短時間で処理できるため、分析にかかる時間を大幅に削減できます。 正確性向上: 人の手作業によるミスを減らし、より正確な分析結果を得られます。 新たな発見: 人間の視点では気づきにくいパターンや相関関係を発見できます。 表をファイルで読み込んで分析してくれるAIの活用例 売上データの分析: 売上推移、顧客属性、商品別の売上などを分析し、マーケティング戦略に活かす。 顧客データの分析: 顧客の購…
AIは、画像認識能力が非常に高いため、表形式のデータも読み込んで処理できるようになりました。特に、OCR(Optical Character Recognition)技術の発展により、画像やPDFなどのファイルに含まれる文字をテキストデータに変換することが可能となり、AIによるデータ分析や自動化がより身近なものとなっています。 なぜAIで表を読み込むのか? 手入力の削減: 大量のデータを手入力する手間を省き、作業効率を向上させます。 データのデジタル化: 紙の資料をデジタルデータに変換することで、検索や共有が容易になります。 データ分析の基盤: 読み込んだデータをAIで分析することで、新たな価…
Coo&RIKUとは?「一人でも多くの方にワンちゃんネコちゃんと暮らす幸せを」をモットーに、全国に店舗を展開するペットショップ「Coo&RIKU」のホームページです。ワンちゃんネコちゃんの画像・動画を多数公開中。出産情報・生命保障制度・各店舗情報もご覧いただけます。全国に200店舗以上のペットショップと動物病院、トリミングルームを展開中、仔犬・仔猫は全店合計で約6000頭を画像、動画でご紹介します。お近くへの店舗への移動も行います。もちろんご希望のワンちゃんネコちゃんをお探しするサービスも行っています。スクレイピングツールの概要ScrapeStormとは、強い機能を持つ、プログラミングが必要な…
日頃からテスト技法ツールGIHOZをご利用いただき誠にありがとうございます。 また、ご感想やフィードバックをいただき誠にありがとうございます。 最新のアップデート情報をお知らせします。 テスト観点ツリーでCSVダウンロードができない不具合を修正しました テスト観点ツリーの編集中に、UNDOやREDOを行うと透明の図形や線が作成され、これが原因でテスト観点ツリーのCSVダウンロードができない場合がある不具合を修正しました。今回の修正により、上記の原因でCSVダウンロードができなかったテスト観点ツリーでも、CSVダウンロードが正常に行えるようになりました。 アカウント削除時に警告ダイアログを表示す…
24卒で新卒入社いたしました、OTTサービス技術部第2グループの比嘉です。 私が配属されて初めて行なった業務で使って便利だったMinIO*1というツールについてご紹介します。 MinIOはクラウドサービスとして提供されていますが、Dockerなどを用いてローカル環境として使用することもできます。 今回はRuby on Rails + MinIOをローカル環境で使う方法とS3を並行して使う際の環境ごとの向き先制御についてお話しします。 背景 問題点1:AWSに接続できない 問題点2:バケット名決まってない MinIOとは LocalStackとの違い 使用環境 DEMO環境構築 1. Rails…
はじめに やりたいこと 今回利用するツール debsecan Amazon Inspector ChatGPT やってみる ChatGPTと戯れながら、分析する 対策してみる 不要なパッケージのアンインストール 必要なパッケージのアップデート そして水際の対策と予防へ まとめ はじめに この記事は Akerun Advent Calendar 2024 - Qiita の13日目の記事です。 こんにちは、SW開発部の @naritaku です。普段はゲートウェイ製品の開発をしています。 新卒で入社してから4年目を迎え、ライフサイクルや運用を意識する仕事が増えてきました。 時間がいくらあっても足…
はじめに この記事はアソビュー! Advent Calendar 2024 の13日目(裏面)です。 こんにちは、アソビューでフロントエンドエンジニアをしている村井です。皆さんは、1つのフォームの中で2つの送信ボタンを扱ったことはありますか? 複数の送信ボタン配置時に押されたボタンを判別したい 私が担当する開発において、同じ入力項目を使って「検索」と「CSVダウンロード」の2つの機能を実装することで、ユーザーが手間なく必要な情報を取得できるようにする必要がありました。 しかし、1つのフォームに複数の送信ボタンを配置すると、どのボタンが押下されたのかを判別する必要があります。 ボタンの区別ができ…
本記事は datatech-jp Advent Calendar 2024 の13日目の記事です。 はじめに Glue Catalogに登録したiceberg tableにAWS GlueJobでデータの書き込みを行うケースは多いかと思います。 通常、Glue Catalogのスキーマに登録されていないカラムを持つデータをGlue Jobで書き込もうとするとエラーとなります。 そのため、新しいカラムを持つデータを書き込む前に alter table add columns をAthenaなどで実行し、iceberg tableのスキーマ変更を行う必要があります。 ALTER TABLE ADD…
こんにちは!GROOVE Xで情報システムを担当している清水です。この記事は、GROOVE X Advent Calendar 2024の13日目の記事です。 GROOVE Xに入社して1年が経ちました。一人でGROOVE Xの情シスに立ち向かっておりますが、今回は普段のお仕事や入社して1年で達成したことなどをお話ししたいと思います。 普段のお仕事のお話 情報システムとしての普段のお仕事は「社内ヘルプデスク」、「アカウント管理」、「PCキッティング」、「発注/請求処理」など、一般的な情シスとしてのお仕事がメインとなります。 社内ヘルプデスク業務では昨年の対応件数が約200件で、GROOVE X…
A novel resident physician examination using clinical simulation video to assess clinical competence in Japan: a cross-sectional studyKiyoshi Shikino, Yuji Nishizaki, Koshi Kataoka, Sho Fukui, Daiki Yokokawa, Taro Shimizu, Yu Yamamoto, Kazuya Nagasaki, Hiroyuki Kobayashi & Yasuharu Tokuda BMC Medica…
はじめに こんにちは、テックリードのかどたみです。 今回もテストネタです!こちらの記事でも紹介しましたが、エモーションテックではデータストアとの結合テストを行っています。RDBに関するコードのテストは実行ごとにデータを生成するのですが、BigQueryに関しては事前にデータをアップロードしてSQLのテストを行っています。 今回はBigQueryのテストデータ準備について紹介したいと思います。 この記事はエモーションテック Advent Calendar 2024の13日目の記事です。 前提 BigQueryのデータもテストの実行ごとに生成すればよいのでは?という意見もあるかと思いますが、以下の…
初めに 開発環境 DNSMOSについて 環境構築 音声ファイルの評価 初めに AI声づくり技術研究会 アドカレ 12日目です。 今回は 音声合成におけるデータセット作成の一つの重要な要素である データセットの音声評価について 比較的新しめの評価手法およびライブラリを触っていきます。 今回触っていくのは、 DNSMOSという マイクロソフトが開発したものになっています。 過去にいくつかの音声データの評価についてのライブラリを触った記事を書いているので、ほかのライブラリも気になる場合はご覧ください。 ayousanz.hatenadiary.jp ayousanz.hatenadiary.jp a…