How do I properly set the default character encoding used by the JVM (1.5.x) programmatically? I have read that -Dfile.encoding=whatever used to be the way to go for older JVMs. I don't have that luxury for reasons I wont get into. I have tried: System.setProperty("file.encoding", "UTF-8"); And the property gets set, but it doesn't seem to cause the final getBytes call below to use UTF8: System.se
やりたいこと 日本語の文字列に任意の文字列が含まれるかどうか判定したい。 二通りのやりかたを書く。 正規表現でマッチさせる use Encode qw/encode/; # source text my $str = 'メッセージ”通信エラー”が表示されます。'; my $p = '通信エラー'; $p = encode('utf8', $p); $str = encode('utf8', $str); if ($str =~ m/$p/) { # マッチをトライ print "Found it!!!"; } index関数を使う あるいは、index関数を使って任意の文字列が含まれるかどうかを判定できる。 ## index function if (index($str, $p) >=0) { print "Found it!!!\n"; } メタ文字にマッチさせたいときは、\でエスケー
using namespace System; using namespace System::Text; int main() { String^ unicodeString = "This string contains the unicode character Pi (\u03a0)"; // Create two different encodings. Encoding^ ascii = Encoding::ASCII; Encoding^ unicode = Encoding::Unicode; // Convert the string into a byte array. array<Byte>^unicodeBytes = unicode->GetBytes( unicodeString ); // Perform the conversion from one enc
Section: Linux User Manual (1) Updated: 2020-06-09 Index JM Home Page roff page 名前 iconv - テキストをある文字符号化から別の文字符号化に変換する 書式 iconv [options] [-f from-encoding] [-t to-encoding] [inputfile]... 説明 iconv プログラムはある符号化 (encoding) からテキストを読み出し、 別の符号化でそのテキストを出力する。 入力が指定されなかった場合、 もしくは入力ファイルとしてダッシュ (-) が指定された場合、 iconv は標準入力から入力を行う。 出力が指定されなかった場合、 iconv は標準出力に出力する。 from-encoding が指定されなかった場合、 デフォルトは現在のロケールの文字符号化から
パソコンで「まる」と変換すると、いろいろな丸印が出てくるのをご存知ですか? 同じ丸印を使っているつもりでいたのに、色々な種類が混在していたことにあとで気づくことも…。事務作業をスムーズにするためにも気を付けておきましょう。 みなさんはパソコン作業中、丸印を利用しますか? 筆者は見出しをつけるときや伏せ字によく使っていますが、あとで見返してみると無意識に2種類くらいの丸印を使っていることがあります。 他の方と共有しているデータだと、その人の使う丸と自分が使う丸の種類が異なっていた…ということも。 丸印が混在して困ること 色々な種類の丸印を使うことで、いくつか不都合が生じます。 一つは見栄え的に美しくないこと。ディスプレイ上だとさほど気にならなくても、印刷したらかなり形が違っているといこともしばしばあります。 もう一つは、検索で該当箇所を見つけづらくなること。筆者も「なぜこあの記述が見つからな
この記事では、.NET に用意されている、さまざまなエンコード スキームを使用してテキストをエンコードおよびデコードするためのクラスの使用方法について説明します。 この手順は、.NET での文字エンコードの概要に関する記事を既に読んでいることを前提としています。 エンコーダーとデコーダー .NET には、さまざまなエンコード システムを使用してテキストをエンコードおよびデコードする、エンコーディング クラスが用意されています。 たとえば、UTF8Encoding クラスには、UTF-8 へのエンコードと UTF-8 からのデコードに関する規則が記述されています。 .NET では、string インスタンスに対して UTF-16 エンコード (UnicodeEncoding クラスによって表されます) が使用されます。 エンコーダーとデコーダーは、他のエンコード スキームでも使用できます。
PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。 SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。
エクセルで文字化けするCSVの修正方法WebシステムからCSVをダウンロードしてパソコンのエクセルやその他のアプリケーションで開いたり、PCで作ったCSVがWebシステムにインポートすると文字化けする場合に、文字化けを回避する方法をご紹介します。 WebシステムからCSVをダウンロードしてパソコンのエクセルで開く、などは業務上よく行う作業だと思います。また、エクセルで整えたCSVファイルをWebシステムにインポートする場合もありますね。このような場合に日本語文字が文字化けしてしまうのを回避する方法をご紹介します。 英語ベースのサイトでも大きなWebサービスだと日本語対応もある事が多いですが、マイナーなサービスを使っているような場合にインポート・エクスポート時の日本語文字化けを回避することができます。また、ご自身でWebサービスを運営する場合に文字化けせずにCSVを扱う方法をご紹介します。
はじめに たとえばこんなDDLを投げる。 CREATE TABLE test ( id int(10) unsigned NOT NULL AUTO_INCREMENT PRIMARY KEY, hoge varchar(256) NOT NULL, UNIQUE KEY (hoge) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; するとエラーになる。 Specified key was too long; max key length is 767 bytes (SQLState:S1000)エラーに書かれているとおり、keyは最大で767byteまでしか使えないらしい。 ちなみにkeyはPRIMARY KEYとUNIQUE KEYがダメ、ただのKEYならOK。 で、どうするか。 1.素直に諦める 上記例ではテーブルがCHARSET=utf8のため1文字3b
gitで日本語ファイルが文字化けする こんばんは。小室です。gitを使っていて日本語のファイル名を入れるとファイル名の表示が崩壊するという経験をしました。 割と今までは放置していたのですが、きちんと日本語ファイル名を表示するコマンドを教えてもらったため、備忘録として記録しておきます。 若干人を小馬鹿にしたようなファイル名のファイルを配置したディレクトリをサンプルとして用意しました。 $ ls -la total 8 drwxr-xr-x 4 komurohiraku staff 136 Mar 25 19:09 . drwxr-xr-x 22 komurohiraku staff 748 Mar 25 19:08 .. drwxr-xr-x 10 komurohiraku staff 340 Mar 25 19:08 .git -rw-r--r-- 1 komurohiraku staff
小さなバイナリを受け渡ししたいけれどファイル共有サービスとか使うのも面倒だしbase64 にしてgist に貼ってしまおうと思ったのですが,nkf コマンドでbase64 にエンコードして,確認のためデコードしてみたら違う結果に. % cat original | nkf -MB > hoge % cat hoge | nkf -mB > fuga % diff original fuga バイナリーファイル original とfuga は異なります % ls -l -rw-r--r-- 1 mk mk 4080 5月 29 20:38 original -rw-r--r-- 1 mk mk 5422 5月 29 20:52 hoge -rw-r--r-- 1 mk mk 3999 5月 29 20:52 fuga Google+ にこのことを書いたら https://plus.goog
問題 自分の環境:UTF-8 SSH接続先:EUC-JP とかよくありますね。 $ export LANG=eucJP とか $ export LANG=ja_JP.UTF-8 してあげてもいいんですが、わざわざやるのも面倒ですし、「ログイン先とこっちのどっちで設定するといいんだ?」みたいに悩みます。 解決法 cocotというツールを使います。 $ brew install cocot でインストール終わり。後は $ cocot -t UTF-8 -p EUC-JP ssh [email protected] とすると、手元のUTF-8環境に合わせて向こう側のEUC-JPをコンバートしてくれます。 参考 Ubuntu日本語フォーラム / GNOMEの文字コードを常にEUC-JPにする方法
アルファベットをすべて選択して半角に統一する文書中のアルファベットをすべて全角や半角に統一したいと思ったことはありませんか。そのためには、文書中のすべてのアルファベット(全角・半角)を選択したあとで、全角や半角に置き換えると簡単です。今回は、その具体的な操作を紹介します。 アルファベットだけを選択できたら便利なのに…… 文書中に「Windows」や「Office」といったアルファベットを入力するとき、皆さんは全角で入力していますか? あるいは半角でしょうか? 私は半角で統一しています。理由は、仕事で書く原稿では半角のアルファベットを要求されるからです。Webサイトや雑誌・書籍などでは、半角アルファベットの方がきれいに見えるため、原稿も半角のアルファベットなのです。 このため、仕事ではない文章を書くとき、たとえば私用のメールを書いたりブログを書いたりするときもアルファベットは半角で統一する癖
Welcome to the Unicode Security Guide! This guide has been designed to give Web application developers, software engineers, and application security researchers a reference for understanding Unicode-related security issues in operating systems, applications, and the Web. The dynamics of Unicode, and character encodings in general, are often misunderstood or poorly implemented, and lead to an array
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く
{{#tags}}- {{label}}
{{/tags}}