2013年12月28日土曜日

文字数、UTF-8 でのバイト数、サロゲートペアの数を数える

  下記のコードは、文字数、UTF-8 で符号化したときのバイト数、サロゲートペアの数、を数え上げるロジックを JavaScript で表現したものです。Java や Objective-C など、文字列を UTF-16 で扱っているプログラミング言語であれば、同じロジックを適用できます。GIST はこちら。Unicode 理解度簡易チェックはこちら。本ブログの英語版はこちら



文字数: 0
UTF-8 でのバイト数: 0
サロゲートペアの数: 0