文字コードの話
こんにちは。
タイトルについて。
現場でWindowsとLinux環境を併用しており、
文字コード変えるだけで処理速度が劇的に変わったのでメモメモ。
文字コードとは?
コンピュータが読み取る文字のことです。
一言でコンピュータといっても、日本、アメリカ、インドのように、色んな種類のコンピュータがあります。
こいつ達がそれぞれ読みやすい母国語といったイメージでしょうか。
どんな種類があるの?
ググったらいっぱい出ました。
知ってるものだけ挙げます。
Unicode
「あいうえお」など、あらかじめ約束(定義)されている文字の集合体です。
JavaやXMLを作成する際、デフォルトで使われてたりします。
絵文字なんかでよく見るやつっすね。
🌍 ←こんなのもUnicodeです。
なんでいっぱい種類あるの?
『そんなん、一つに統合してればいいじゃん。めんどくさいな。』
エンジニアなら誰しも思うハズ!ハズである!
調べてみた結果、こんな回答っぽいです。
『コンピュータが発展する過程でいろいろあったから統合できなかったの!』
人間と同じようなもんスね。
全世界で英語だけ使ってればラクなんでしょうけど、今さら不可能ですし。
コンピュータにもいろんな人種(機種?)があるということ!
仕事で。
今の現場にて、ストアドをせこせこ作成中でして。
こんな手順でやってたんです。
1.Windows上のサクラエディタでコーディング
2.LinuxからSQLPlusにログインしてコピペ実行
Windows上で作成しているので、S-JISで作成されたコードを、UTF-8を欲しがってるLinuxに無理やり食わせてたんですね。
健気ないい子(PC)なので、S-JISでも読み込んでくれてたのです。1回読むのに10秒弱かかっていました。
数回やってると、文字コードを変えていないことに気づき、文字コードをUTF-8にしてあげると
あら不思議!
1秒で読み込んでくれるようになりました!
それまでは必死にS-JISを解読してくれてたんだなあと思うと、PCが可愛く見えました。
あれ?見えませんか?( ゚Д゚)