◎正当な理由による書き込みの削除について:      生島英之とみられる方へ:

文字コード総合スレ Part12 ->画像>17枚


動画、画像抽出 || この掲示板へ 類似スレ 掲示板一覧 人気スレ 動画人気順

このスレへの固定リンク: http://5chb.net/r/tech/1544931495/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

1デフォルトの名無しさん2018/12/16(日) 12:38:15.61ID:VlX3xGEw
Windows NTは初代からUnicodeがネイティブの文字コードです。cp932ではありません。
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、Shift_JIS、JIS、EUC、Unicode、UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
 (スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
 (隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/
文字コード総合スレ part6 http://hibari.2ch.net/test/read.cgi/tech/1278923059/
文字コード総合スレ part7 http://toro.2ch.net/test/read.cgi/tech/1306595564/
文字コード総合スレ part8 http://peace.2ch.net/test/read.cgi/tech/1354248962/
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
文字コード総合スレ Part10 http://mevius.2ch.net/test/read.cgi/tech/1444822140/
文字コード総合スレ Part11 http://2chb.net/r/tech/1516629503/

2デフォルトの名無しさん2018/12/16(日) 12:40:36.99ID:VlX3xGEw
■参考サイト
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
JIS X 4061
日本語文字列照合順番
http://www.jisc.go.jp/

3デフォルトの名無しさん2018/12/16(日) 12:45:08.07ID:VlX3xGEw
■これまでに行われた議論
・Windows 10のコマンドプロンプトでUTF-8を使用する場合chcp 65001で切替可能。日本語入力等も可
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。Unicodeでは機種依存文字ではない。
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → 対応済み
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
 Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
 陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・Unicodeのzipが文字化けする。→Windows 7は公式パッチで対応可能。8以降は標準対応

4デフォルトの名無しさん2018/12/16(日) 12:46:00.56ID:VlX3xGEw
・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「噁心」簡化政策によると「恶(U+6076)」に統一。口偏+恶(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
 U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
 ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
 中国ではってレベルじゃねーぞ。
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか

5デフォルトの名無しさん2018/12/16(日) 12:46:16.07ID:VlX3xGEw
もうひとつの過去スレ:
文字コード統一スレ 1文字目
http://pc8.2ch.net/test/read.cgi/tech/1109171258/

隔離スレ:
UnicodeとUTF-8の違いは?
http://pc12.2ch.net/test/read.cgi/tech/1177930957/
UnicodeとUTF-8の違いは? その2
http://hibari.2ch.net/test/read.cgi/tech/1274937437/
UnicodeとUTF-8の違いは? その2
http://toro.2ch.net/test/read.cgi/tech/1291075205/
UnicodeとUTF-8の違い4(インディアン隔離スレ)
http://toro.2ch.net/test/read.cgi/tech/1342963035/

6デフォルトの名無しさん2018/12/16(日) 12:48:18.57ID:VlX3xGEw

7デフォルトの名無しさん2018/12/16(日) 12:49:13.25ID:VlX3xGEw
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
 表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
 charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
 U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
 再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
 あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。

8デフォルトの名無しさん2018/12/16(日) 17:19:29.50ID:0LUE4AGb
oo|o|o|||o|o|o|o|||ooo|oo|o|ooooo||o||o|oooo|||o||||o|oo|o|||o|o|o|o|o|oo
ooo||o|o|||||||o|o||oo|ooo||ooo|o||oooo|oo|o||oo|||ooo||||oo||ooooo||oo||
oo||ooo|o||o||ooooo|oo|oo|o|o|||o|||||o|o|oo||oo|ooo||o||||o|o||o||o|oooo
ooo|||||o|oo|||ooo|o|oo|||||ooooooooooo|||ooo|||o||||oo|oo|||ooo|o||oo|||
ooooo|ooo||o|oo|||oooo|oo|||||ooooo||o|||oo|||o|o|o|o||||o|||||oo|oo|oo|o
||o|oo||oooooo||o|oo||o|||ooo||oo||oo||ooo|o|o|oo|||||o|o|o|||oooooo|o|||
||o||||o|oo|||o||oo||ooo|ooo|oo|||oo|o|||o|||oo|oo|oo|o|||||oooo||ooooooo
oo|oo|||||oo|||||o|oo|o||oo|||o|ooo||o|oo|||o||ooooooooo|ooooo|o|||o||o||
o|oo|o||o|oo|oo|oo|o|o|o|oo|o||||oo|oo||ooo|ooooo||||o|oo|oo|||o|||oo||||
|o||||o|||oo|o||o||oo||oooo|oo|o||oooo|oo|||||||oo|o|o|ooo|oooo||||ooo|oo
ooooo|||oo||oo|o||o|ooooooo||||||o|o||o|o|ooo||oo||o||oooo||oo|oo|||o||||
|o|||oo||o||o|o|||o||oooo|oo|||o||oo|ooooo|o|||o|||oo|ooo|ooo|||oo||oo|oo
||ooo|||ooo|||o|ooooo||||oo|||||oo||ooo|o||o||ooo|oo||oo|oo|||o|o|o|oooo|
|||oo|o||o||o|ooooooooo|o|o|||||oo|o||ooo|o||o|oo||||oo|o||o||o|ooo|||ooo
oooo|||ooooo||o||oo|ooo|||||o|oo|||o||o||ooo|ooo||oo||oo||o||o|oo|o|oo|||
oooooo||||oo|o||oo|||o|ooooo||ooo||||||oooo|||||oo||||ooo|||o|o|o|o||oooo
o|o|o|oo|o|oooo|o|ooo||oo|oo||||||||ooo|o||o||oo||o|||ooo|o||oo||oo||oo|o
oo||||oooooo|o||o|o|oooo||o|||oo|ooo|o|o|o|ooo||o|o|oo|o|||o|o|o|||o||o||
oo|oooo|oo|o|oo||||oo|||o||o|o||o||o|oooo|o||||o|o||o|ooooo||ooo||||||ooo
oo||o|oo||||oo|||||||||ooo|oo|||oo||oooo||o|o|o||||ooooooooo|oo|||oo|oo|o
o|o|||||o|o|||oo|oo|o|||o|o|||oo|oo||ooo|oo|oo||oooo||||o||||ooooooo||ooo
o|||||oo|o|||oo|ooooo|ooooo||o||oo||ooo||||oo|oooo||||oo|oooo||oo|o||||||
|oo|oo|||||oooooo||||ooo|||||ooo|oo|o|||oo|o|o|||o||ooo||ooo|o|oo|||o|ooo
ooooo|o|oo||o||||oo||oo|o|ooo||o|o|o|||ooo||||||o||oo|ooo||o|o||oo|o||ooo
|oo|ooooo||o||o|o|oo|oo|||ooo||||o|oo|oo|o||||o|oo|||o||o|||||ooooo|o|ooo
|o||ooooooo|||oo|ooo|ooo||||ooo||oo||ooo|||||||ooo|o|ooooo|||||o|o|o|||o|

9デフォルトの名無しさん2018/12/16(日) 21:10:16.93ID:3q5iKhWM
こんなスレあったんだ
Windowsのフォントって、どのフォントがどのコード体系とか字体を使っている。
などを纏めているところってある??

10デフォルトの名無しさん2018/12/16(日) 23:11:32.43ID:/e3hQGaS
ちょっと考えれば分かるようなことをなぜ聞くんだろう。

11デフォルトの名無しさん2018/12/17(月) 20:40:27.55ID:kiEfSjeK
ちょっと考えれば解るなんてすごい人だな。
ちょっと書いてみ

12デフォルトの名無しさん2018/12/17(月) 21:18:18.25ID:lO+98ZHR
あげ

13デフォルトの名無しさん2018/12/18(火) 03:08:10.44ID:81OlOyOQ
nkf - Network Kanji Filter Fork
https://ja.osdn.net/projects/nkf/scm/git/nkf/
v2.1.5
2018-12-15 18:19:02

14デフォルトの名無しさん2018/12/18(火) 11:22:36.98ID:/M0/bFGF
>やはり頭悪いのはunicodeと符号化を混同してる

ここは同意

>2つ以上のオクテットを使う符号単位で
>BOM入れないヤツは池沼だからな

これは嘘

15デフォルトの名無しさん2018/12/19(水) 00:20:13.76ID:jOXn0Ht9
低学歴知恵遅れには
エンディアンの概念がないのが
よおく分かったわ

16デフォルトの名無しさん2018/12/19(水) 00:28:37.33ID:t+yG2AJO
CPUの内部形式とデータには何の関係もない
現にネットワークデータはCPUとは無関係の並びになってる

17デフォルトの名無しさん2018/12/19(水) 00:54:40.89ID:s0UhV0Jg
やっぱあれ書いたの半角さんだったんだw

18デフォルトの名無しさん2018/12/19(水) 00:57:03.62ID:jOXn0Ht9
うわあ。。。
マジでいってんの

こういうマジもんの低学歴がこの板で
はば利かせてるのがよく分かるわ

マジで頭悪いことを
ハジもなくなんの躊躇もなくいうからな

プログラムで
いちいエンディアン変換してんのすら
しらないらしいわ

当然Unicodeのエンコード方法にも
ビッグエディアンとリトルエンディアンがある

19デフォルトの名無しさん2018/12/19(水) 00:58:18.75ID:jOXn0Ht9
もうね低学歴すぎてヤバイって
ちなみネットワークでデータを交換するときは
暗黙で基本はビッグエンディアンになってる

常識だからなコレ

20デフォルトの名無しさん2018/12/19(水) 01:00:17.18ID:jOXn0Ht9
低学歴知恵遅れって
なんでものすごい頭悪いことを
自信満々にいうわけ?

21デフォルトの名無しさん2018/12/19(水) 01:12:57.34ID:jOXn0Ht9
ちなみipアドレスの並びはビックエンディアンになってる
ポート番号も当然ビックエンディアンになってる

ソケット通信のプログラム組んだことあるなら
ポート番号設定するのにhtons(コレはオクテット2つになる)という関数を使ったことあるハズだ

ちなみにこの関数はリトルエンディアンの計算機なら
ビッグエンディアンに変換された値がかえってくる

ビッグエンディアンの計算機なら
そのままビッグエンディアンの値がかえってくる

22デフォルトの名無しさん2018/12/19(水) 01:39:07.45ID:B2A2n/bL
半角カタカナはAAにしか見えない

23デフォルトの名無しさん2018/12/19(水) 06:24:21.16ID:wJcYDzdz
最近の子はバイトオーダーなんて意識しないからな
常識としては知っててほしいがけど
低レベルな処理書かなきゃ関係ないし触れることもないだろうから知らなくても困らんな
アラインメントとかパディングとかも同様

24デフォルトの名無しさん2018/12/19(水) 12:49:47.13ID:JIdS0sYR
エンディアン嘘つかない

25デフォルトの名無しさん2018/12/19(水) 16:46:27.07ID:R6d6JT/9
>>23
バイトオーダーを意識する機会が減ったのは、xmlやjsonなどテキスト形式でデータ受け渡しすることが多くなったから。
テキスト形式ならバイトオーダーを意識せずに済むし、スクリプト言語で扱うのにも便利。

26デフォルトの名無しさん2018/12/19(水) 20:30:33.10ID:gznchIbF
いやいや、テキストでもUTF16とかUTF32ならめっちゃ意識するやん。

27 ◆QZaw55cn4c 2018/12/19(水) 20:51:34.30ID:C9bIO99C
>>24
豆知識、endian とは?
もともとは、卵を丸い方の端 (big end) から割る人々(Big Endians)と尖った方の端から割る人々 (Little Endians) との対立を表したものだった

28デフォルトの名無しさん2018/12/20(木) 01:35:41.75ID:jYg2YnYV
そういえばハンプティダンプティの絵文字がない

29デフォルトの名無しさん2018/12/20(木) 03:36:13.08ID:Epiz8Tj2
バイトオーダーやアラインメントは、C/C++以外の言語でバイナリデータを使おうとした時に強く意識することになる。
C/C++で開発している時はコンパイラが自動的に配置・取得してくれるデータを、スクリプト言語では自力でオフセット調整して配置・取得しなければならない。
C/C++より簡単なことが長所だったはずのC#・Java・Perl・Python言語などで、低レベルなオフセット調節を自力で行う必要に迫られる皮肉な状況が起きる。

30デフォルトの名無しさん2018/12/20(木) 04:20:27.30ID:ojhJ7lIE
> バイトオーダーやアラインメントは、C/C++以外の言語でバイナリデータを使おうとした時に強く意識することになる。
C/C++言語以外ではライブラリが処理してしまうんで意識しないかな
C/C++ライブラリを呼び出すライブラリを作るときは意識するだろうけど、
それって結局C/C++言語で書くんで、あれ?意識するのはC/C++かw

31デフォルトの名無しさん2018/12/20(木) 06:53:32.14ID:Epiz8Tj2
>>30
例えばWindows環境だと、C/C++以外の言語でWin32API関数を固有の構造体を入出力に使う場合、アセンブリ並みに低レベルなオフセット調節を自力で行う必要に迫られる。

32デフォルトの名無しさん2018/12/20(木) 07:18:15.99ID:ojhJ7lIE
× 例えばWindows環境だと、C/C++以外の言語でWin32API関数を固有の構造体を入出力に使う場合、アセンブリ並みに低レベルなオフセット調節を自力で行う必要に迫られる。
○ 例えばWindows環境だと、C/C++以外の言語でWin32API関数を固有の構造体を入出力に使う場合、C/C++並みに低レベルなオフセット調節を自力で行う必要に迫られる。

33 ◆QZaw55cn4c 2018/12/20(木) 07:37:44.12ID:W1ypdRwu
>>32
うーん、具体的な win32api 名(だけでいいです)を例示してください.

34デフォルトの名無しさん2018/12/20(木) 07:43:09.20ID:ojhJ7lIE
>>31に聞いてください

35デフォルトの名無しさん2018/12/20(木) 08:04:20.01ID:Epiz8Tj2
>>32
勝手に書き換えないでもらいたい。
C/C++だと構造体の各メンバ変数のアラインメントを意識しなくていいが、他の言語だとそうはいかないので、アセンブリと同じようなオフセット調節が必要。
SendMessage(WM_COPYDATA)の送受信データの読み書きなど例はいくらでもある。

36デフォルトの名無しさん2018/12/20(木) 10:08:25.12ID:48mnxvPx
>>35
>C/C++だと構造体の各メンバ変数のアラインメントを意識しなくていいが

誰に騙された?

37デフォルトの名無しさん2018/12/20(木) 13:46:21.36ID:P4Rv6f7s
実行メモリ上はともかく
ファイルやネットワークストリームでLEにするアホいるんか?

38デフォルトの名無しさん2018/12/20(木) 16:58:53.93ID:Epiz8Tj2
エンディアンもさることながら32/64bit整数の幅調節が厄介。
使っている言語が32/64bitどちら向けでビルドされたものなのかによって構造体メンバのアラインメントを適切に処理する必要が出てくる。
言い換えれば、C/C++で作った構造体をバイト列で渡し、C/C++以外の言語でバイト列を構造体に復元する処理が厄介。
単に構造体の64bit整数メンバだけ気を付けるのではダメで、構造体の全メンバのアラインメントそのものが大きく変わりうることに注意する必要がある。

39デフォルトの名無しさん2018/12/20(木) 18:26:27.50ID:6OEKrw3R
いや、だからさ、その程度までは理解できてるのに、何故「C/C++だと構造体の各メンバ変数のアラインメントを意識しなくていいが」なんてことを言っちゃうの?
それとアラインメントの話とバイトオーダーの話を混同しないように気を付けた方がいいよ。

40デフォルトの名無しさん2018/12/20(木) 19:07:05.38ID:oZOw2Nhk
C/C++しらないけど、魔法のようにアライメントを
勝手に調整してくれるんじゃないの?想像しただけで

41デフォルトの名無しさん2018/12/20(木) 21:19:19.38ID:/Up9dRku
Unicodeは普通にリトルエンディアンもありだ

なんで Byte Order Mark(BOM) がファイルの先頭に入ってるのか分かってない
Javaバイトコードのcafe babeみたいな飾りだと思ってんの

リトルエンディアンの計算機ばっかりがあるとこで
ビッグエンディアンでファイルを保存する理由なんかないからな

当然、そういったコンテンツデータがHTTPでも流れてくる

42デフォルトの名無しさん2018/12/20(木) 21:20:17.21ID:/Up9dRku
やっぱりこの板には
クルクルパーしかいない

そしてそのクルクルパーの声だけがでかい

やっぱりな低学歴知恵遅れは
この板から排除する必要がある
板が正常に機能しない

43デフォルトの名無しさん2018/12/20(木) 21:26:52.62ID:gpCj1726
アライメントはふつうコンパイラが適切に調整してくれるよね。
32/64bitで整数サイズの違いでメンバオフセットが変わるってのはアライメントとは別の話。

44デフォルトの名無しさん2018/12/20(木) 21:31:46.95ID:/Up9dRku
32bitなら
ちゃんと32bitに詰まるように
メンバの順序かえる

45デフォルトの名無しさん2018/12/20(木) 21:38:37.03ID:/Up9dRku
char unko
char foo
int aho
short poi
char baka
int manuke
short boo
char woo




int manuke
----
int aho
----
short poi
short boo
----
char unko
char foo
char baka
char woo


64bitでも考え方は同じ
強制パッキングのオプション使えるコンパイラもある

46デフォルトの名無しさん2018/12/20(木) 21:42:31.32ID:oZOw2Nhk
今問題としてるのはファイルの話だ。
32bitシステムで作られたファイルを64bitシステムに
持ってきたとしてもファイルの内容が変わるわけじゃない

つまりC/C++で32bitでint型で扱っていたからと言って
64bitでもint型で扱ってはいけないということだ

47デフォルトの名無しさん2018/12/20(木) 21:44:56.46ID:/Up9dRku
バカがよくやる誤りは
メモリ境界をまたぐ位置で64bit値を参照したりして
バスエラーを起こす


シリアライズデータを直に参照できると思ってるバカがあとをたたない
CISCの計算機しか使ったことないサル並の脳みそのヤツがよくやる

48デフォルトの名無しさん2018/12/20(木) 21:53:38.53ID:/Up9dRku
そんなファイル読み込むときに
普通にintなんか使わないからな
そんなことは低学歴知恵遅れしか発想できない


utf16なら16bit単位(uint16_t)
utf32なら32bit単位(uint16_t)
で読み込む

リトルエンディアンの計算機で
ビッグエンディアンのUnicode読む場合は
16bit単位なら16bit単位でオクテット列の並びを逆転させる
32bit単位なら32bit単位でオクテット列の並びを逆転させる

リトルエンディアンの計算機で
リトルエンディアンのファイル読み込むならオクテット列の並びを逆転させる必要はない

ビッグエンディアンならその逆になる

低学歴知恵遅れはこういった基本的な理解がない

49デフォルトの名無しさん2018/12/20(木) 21:59:01.65ID:gpCj1726
>>45
C/C++の規格じゃ構造体のメンバは宣言された順にアドレスが増加するよう並べられることになっている。
仮に>>45のような最適化を行うことができる処理系が存在したとしても、一般的と言えるものではない。

50デフォルトの名無しさん2018/12/20(木) 21:59:21.79ID:KozHiIkR
one little two little three little endians

51デフォルトの名無しさん2018/12/20(木) 22:00:12.93ID:/Up9dRku
だからそう書いてる
手動で自分で並べ替える

52デフォルトの名無しさん2018/12/20(木) 22:12:47.37ID:gpCj1726
自分で並べ替えろって話か。それは勘違いした、すまん。

53デフォルトの名無しさん2018/12/20(木) 22:23:36.55ID:tzmwAGAt
結局C/C++でもアライメント意識して、自分で適切な型を選択しているってわけさ
他の言語でも一緒。ただし型が違うからバイト数を指定するだけの話

54デフォルトの名無しさん2018/12/20(木) 23:02:54.77ID:Epiz8Tj2
PGならば、楽するためにJava/C#/Python/Perl/Rubyなどを使ってたはずなのに、C++よりめんどくさくなって心が折れそうになる経験を一度はしておいたほうがいい。

55デフォルトの名無しさん2018/12/20(木) 23:23:21.93ID:tzmwAGAt
いや、C++よりも面倒なことってないから
そんな経験するのは無理だよ

56デフォルトの名無しさん2018/12/20(木) 23:49:16.62ID:/Up9dRku
やはり低学歴知恵遅れには
C++はむり

レスみればよく分かる
レスから頭の悪さがにじみ出てる

低学歴のレスはすぐにわかるわ
残念なことに

57デフォルトの名無しさん2018/12/21(金) 12:36:36.76ID:C7PBMVlX
データのアラインメントはどんな言語を使うにしても気にする必要がある。
しかし、Windows が VisualC++ でビルドされていて、VisualC++
もしくは互換のアラインメントができる言語でアプリを組めば、
気にしなくてもよい、ということだけだろう。

58デフォルトの名無しさん2018/12/21(金) 14:56:12.53ID:wVAQd9sY
>>57
gcc も同じだよ。64bit版linux gccはwchar_tを16ビットにするか32ビットにするかを切り替えビルドできるからさらに厄介。
構造体を丸ごとダンプしたバイナリデータを同じOS上の別プロセスに渡すのは繊細な注意がいる。

59デフォルトの名無しさん2018/12/21(金) 16:01:10.01ID:2iFVCAc3
で、なんだっけ?バイナリファイルのデータが
16bitで格納されていようが32bitで格納されていようが
C/C++だったらアライメントを勝手に調整してくれるんだっけw
へー、勝手にねー、intで扱ってれば、勝手に調整してくれるんだーw

60デフォルトの名無しさん2018/12/21(金) 16:43:13.79ID:wVAQd9sY
intが16bitの組み込み向けプログラムであっても同じコンパイルオプションで作ったモジュール同士ならバイナリの復元はC言語の型キャストだけで可能。
構造体が仕様として公開されている場合、どの言語であれアラインメントを意識した実装が必要になるが、C言語は実装コストが最も低くなる傾向はある。
スクリプト言語を使う人がアラインメントを意識せずにすんでいるのは、ライブラリ実装した人が頑張ってくれた・くれているおかげ。

61デフォルトの名無しさん2018/12/21(金) 17:01:59.77ID:2iFVCAc3
一方他の言語では、指定したオフセットから何バイト読み込むか指定するだけなのであった

62デフォルトの名無しさん2018/12/21(金) 17:02:51.29ID:2iFVCAc3
C言語は、ヘッダファイル書いた人が頑張ってくれた・くれているおかげ

63デフォルトの名無しさん2018/12/21(金) 17:23:19.85ID:wVAQd9sY
>>61
先生。指定したオフセットから何バイト読み込むか指定する作業は、まさにアセンブラと同レベルの作業じゃありませんか。違いますか、先生。

64デフォルトの名無しさん2018/12/21(金) 17:47:28.44ID:2iFVCAc3
>>63
違いますね。memcpy相当ですから

65デフォルトの名無しさん2018/12/21(金) 18:13:53.48ID:ORTv1gtC
低学歴知恵遅れ先生はC/C++スレだけじゃなくてここにもくるようになったのか

66デフォルトの名無しさん2018/12/21(金) 21:50:05.59ID:0muy2Btq
>>65
色んなところにいるよ

67デフォルトの名無しさん2018/12/21(金) 22:02:28.52ID:SVNbSsFy
相変わらず日本語の読解に問題がありそうな奴がいるなぁ。

68デフォルトの名無しさん2018/12/21(金) 23:50:03.63ID:j37Ohb1y
まず低学歴知恵遅れは
低学歴知恵遅れの自覚がないからな

69デフォルトの名無しさん2018/12/22(土) 11:38:13.24ID:boWDflNh
実行時に使用中のCPUがLEかBEかを判定するプログラムを
Cでサンプル欲しいのですがどこかにありますか?

70デフォルトの名無しさん2018/12/22(土) 13:36:46.26ID:aa5NQG9N
bool is_bigendian() {
 return htons(1) == 1;
}

71デフォルトの名無しさん2018/12/31(月) 08:52:03.67ID:Tj5kujd4
C1制御文字の<128>って多くの文字コードで「PAD」と名付けられているのに
UnicodeでのU+0080はxxxみたいに無名なのって理由ある?

72デフォルトの名無しさん2018/12/31(月) 13:29:33.60ID:8Z6ezMyM
U+0080,U+0081,U+0084,U+0099は、ISO6429/ECMA-48で制御文字に含まれていない
というか削除されてる
http://www.ecma-international.org/publications/standards/Ecma-048.htm
http://www.ecma-international.org/publications/files/ECMA-ST/Ecma-048.pdf

WikipediaソースによるとUnicode初期ドラフトにはU+0080も入っていたみたいなことも書かれてるね
https://en.wikipedia.org/wiki/C0_and_C1_control_codes#C1_set

73デフォルトの名無しさん2019/01/01(火) 01:45:48.02ID:kXQfWbAp
なんてこった
エイプリルフールだって?

74デフォルトの名無しさん2019/01/01(火) 23:58:04.80ID:j16q/z48
あけましておめでとうございます
2019年は何が起きるかしらね

75デフォルトの名無しさん2019/01/02(水) 00:20:17.09ID:R6tFufwf
エイプリルフールはまだだけど元号ネタとかあるだろうな
新元号『NEO平成』に決定みたいな

76デフォルトの名無しさん2019/01/02(水) 11:30:40.86ID:6YX6jwF2
新元号『��』

77デフォルトの名無しさん2019/01/02(水) 22:33:06.92ID:Fz1uszjs
新元号が分からなくてグリフが間に合わないからUnicode 12.1を出すってのは仕方ないけど
新元号の組字のためだけにAdobeJapan1を改訂するってのは馬鹿げてる

78デフォルトの名無しさん2019/01/03(木) 00:28:36.38ID:agNiXwq6
元号は安晋に内定してるだろ

79デフォルトの名無しさん2019/01/03(木) 09:15:51.35ID:IESB6EpY
MS-DOS でのプログラミングではメモリ内の特定のバイトについて
文字の中の何バイト目かを 1 バイトずつ遡って調べるということも
あったようだけど自分ではそういうコードを書いた記憶がない。
いや、もしかしたらあったのかもしれないけど。
EUC-JP の場合は ASCII なバイトかシングルシフトが現れた時点で
確定するようだけど。Unicode の時代になって良かったね。
まあ、そんなようなことを今更思った。あけましておめでとう。

80デフォルトの名無しさん2019/01/03(木) 21:04:56.87ID:ejflNGhp
>>72
ありがとう。
なにか事情があったんだろうけど、なんだろうね……。

81デフォルトの名無しさん2019/01/04(金) 13:59:50.88ID:8DNHKlb4
あけおめ

>>79
大昔のことだけど、SJIS 文字列の末尾から検索するプログラム書いてた時は「SJIS、お前はマジで殺す」という気持ちで一杯でした。
もう二度とあんなことはやりたくない。

82792019/01/04(金) 17:36:17.24ID:opswFKCW
ありがとう、まさにそういうことです。
p=strchr( path,'\\'); /* おい *p 、お前は本当に '\\' なのか? 表とかじゃないのか? */

83デフォルトの名無しさん2019/01/04(金) 18:54:02.55ID:3Gm4cMvD
Windows環境ならそこは _mbschr() でしょ。

84デフォルトの名無しさん2019/01/04(金) 19:30:16.38ID:EMYjNY+E
UnicodeはSJISよりも扱いが複雑だけど
ライブラリが揃ってるからねー
一文字が1バイトだろうと3バイトだろうと
2文字で1文字を表していようが、簡単に一文字判定ができちゃう

85デフォルトの名無しさん2019/01/04(金) 21:30:36.38ID:atCGQoq2
複数コードポイントで1文字を表すのって上限って決まってないの?青天井?

86デフォルトの名無しさん2019/01/04(金) 22:02:58.14ID:rG/yv5Zr
UTF-8なら、最大四バイトだけど、そういうことじゃなくて?

87デフォルトの名無しさん2019/01/04(金) 22:11:30.43ID:FtJLKwOD
>>86
先ずコードポイントの意味を理解してから質問した方が良い

88デフォルトの名無しさん2019/01/04(金) 22:27:33.32ID:atCGQoq2
なんかごめん

89デフォルトの名無しさん2019/01/04(金) 23:45:49.70ID:EMYjNY+E
>>86
最大4バイトじゃないよ

漢字1文字が最大8バイト、Unicodeの「IVS」とは?
https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/

Unicodeは複雑過ぎてライブラリを使わないと正しく扱うのはまず無理

もし自力で文字数をカウントしたいならこれとか読んで頑張れ
https://www.kthree.co.jp/kihelp/index.html?page=data/ivs&type=html

90デフォルトの名無しさん2019/01/04(金) 23:54:23.74ID:EMYjNY+E
ZWJシーケンス というのもあるね
https://qiita.com/nonanona/items/b148c212ba7c24942e93#%E7%B5%B5%E6%96%87%E5%AD%97%E7%94%A8%E3%81%AE%E7%95%B0%E4%BD%93%E5%AD%97%E3%82%BB%E3%83%AC%E3%82%AF%E3%82%BFemoji-variation-selector%E3%81%A8%E3%81%AF

見た目上は1文字なのに例えば U+1F468 U+200D U+1F3A8 みたいに3文字になる。

91デフォルトの名無しさん2019/01/05(土) 00:00:08.40ID:41KVD0qa
https://unicode.org/emoji/charts/emoji-zwj-sequences.html#1f441_fe0f_200d_1f5e8_fe0f
酷いねー。見た目上は1文字なのにU+1F441 U+FE0F U+200D U+1F5E8 U+FE0F と5文字分使ってる
バイト数だと17バイトみたいね

92デフォルトの名無しさん2019/01/05(土) 00:03:32.79ID:fLBZxFEd
合成文字・絵文字とかが絡むともっと地獄になるけどな
http://tech.albert2005.co.jp/201/
https://qiita.com/nonanona/items/b148c212ba7c24942e93

93デフォルトの名無しさん2019/01/05(土) 00:03:39.55ID:41KVD0qa
ZWJを使うと最大11文字だって。
https://n2p.co.jp/blog/column/counting-characters-on-twitter/

94デフォルトの名無しさん2019/01/05(土) 00:07:24.29ID:41KVD0qa
Unicodeは1文字の概念も破綻しちゃったね
1文字に見えるやろ?でもこれは11文字なんや
全く意味がわからないw

95デフォルトの名無しさん2019/01/05(土) 00:11:16.35ID:41KVD0qa
見た目上の1文字は最大4バイト×11文字で44バイトなのかな?w
11文字ってのは今現在存在する最大が11文字ってだけで青天井?
もうライブラリ使ってないと無理だね

96 ◆QZaw55cn4c 2019/01/05(土) 00:12:47.39ID:F8+3E8Pf
世の中にあるすべての文字をコード化してやる!
という意義には賛同していたんですけれども、(主に経済的理由により)絵文字が入った時点で失望してしまいました…

仕切りなおしたほうがいいんじゃないですか?

97デフォルトの名無しさん2019/01/05(土) 00:38:07.30ID:198zQJKz
仕切りなおしてもBCで絵文字は入ります。
というかもはや絵文字は世界中のスマホ/SNSユーザーに愛用されています。
ここまでくるともはや後戻りはできないのです。

98デフォルトの名無しさん2019/01/05(土) 00:46:41.68ID:fLBZxFEd
仕切りなおすどころかUnicodeの規格がさらに拡張されて状況悪化するんだろうなあ
Unicode12も来年・・・じゃないやもう今年リリースされる予定のはずだし

99デフォルトの名無しさん2019/01/05(土) 01:28:42.81ID:41KVD0qa
絵文字は象形文字の発展版なんだから
文字扱いするのは当然

100デフォルトの名無しさん2019/01/05(土) 12:51:39.06ID:l3tIMYns
現代の文字は自然発生するわけでも王朝が発布するわけでもなくユニコードコンソーシアムが追加するのだ

101デフォルトの名無しさん2019/01/05(土) 13:09:21.22ID:Lsf8iZgV
>>97
世界には文盲がわんさか居るから結局象形文字が必要ってことか

102デフォルトの名無しさん2019/01/05(土) 15:08:59.93ID:WAT5i9L3
世界が認めたニッポンのスゴーイ文化やぞ

103デフォルトの名無しさん2019/01/05(土) 15:19:11.13ID:dE0KuiGH
当の日本人にすら絵文字を扱いきれてなかったのに
そんなもんをコード化したら破綻するに決まってるんだよなぁ……

104デフォルトの名無しさん2019/01/05(土) 16:29:31.32ID:XzO5Y/Fl
1964年の東京五輪での案内表示がきっかけでしょ絵文字の開花は。

105 ◆QZaw55cn4c 2019/01/05(土) 17:03:40.22ID:F8+3E8Pf
>>99
絵文字と象形文字の間には確固たる断絶があります、おっしゃるような連続的なものではないと考えています
例えば、ある象形文字と別の象形文字との違いははっきりしていますが、ある絵文字と別の絵文字との違いを示す具体的な指標はないのでは?
それとも、これは私の知らなかったことですが、もしかして絵文字の内容はピクセル単位、あるいはベクターイメージですでに定義されているのですか?

106デフォルトの名無しさん2019/01/05(土) 17:24:42.05ID:41KVD0qa
はい

107デフォルトの名無しさん2019/01/05(土) 19:28:07.65ID:2yRzjNJO
便器に◎とか〓とか描いてあっても何のことか判らんで悩むだけやぞ

108デフォルトの名無しさん2019/01/06(日) 10:52:08.85ID:6OQPByjN
田穣崇さん『ドコモの絵文字にうんちを入れたかったのですが、社内で大反対されまして…』 うんちの絵文字がUnicodeに登録されるまでの裏話
https://togetter.com/li/1305754

109デフォルトの名無しさん2019/01/09(水) 21:32:33.71ID:Duz5lH4D
うんちにも色バリエーションつけたいなあ

110デフォルトの名無しさん2019/01/10(木) 11:56:03.90ID:+qf2Eno1
カフェで野良WiFiのSSIDが絵文字になってたわ
うっかりつなぎそうになった

111デフォルトの名無しさん2019/01/10(木) 14:02:26.62ID:LOQSfV+x
形状バリエーションも欲しい
巻きうんち/一本糞/ビチグソ

112デフォルトの名無しさん2019/01/10(木) 18:35:20.73ID:1lL5sq44
POO WITH TURBANとかもほしい

113デフォルトの名無しさん2019/01/14(月) 01:16:50.95ID:s6eFaywu
U+FFFCとU+FFFDの違いってなんだろう。
一応https://www.unicode.org/charts/PDF/UFFF0.pdf←ここを読んでみたんだが
U+FFFCが「Unicodeの範囲で異常」、U+FFFDが「Unicodeですらない」
ことを示す文字なのかな?

114デフォルトの名無しさん2019/01/14(月) 11:40:16.54ID:tN6VIVTj
Unicodeですらないのに「U+〜」という表記はこれ如何にw

115デフォルトの名無しさん2019/01/15(火) 16:00:55.99ID:exaSay/9
Replacement Characters: U+FFFC–U+FFFD

U+FFFC. The U+FFFC object replacement character is used as an insertion point for objects located within a stream of text.
All other information about the object is kept outside the character data stream.
Internally it is a dummy character that acts as an anchor point for the object’s formatting information.
In addition to assuring correct placement of an object in a data stream, the object replacement character allows the use of general stream-based algorithms for any textual aspects of embedded objects.

U+FFFD. The U+FFFD replacement character is the general substitute character in the Unicode Standard.
It can be substituted for any “unknown” character in another encoding that cannot be mapped in terms of known Unicode characters.
It can also be used as one means of indicating a conversion error, when encountering an ill-formed sequence in a conversion between Unicode encoding forms.
See Section 3.9, Unicode Encoding Forms for detailed recommendations on the use of U+FFFD as replacement for ill-formed sequences. See also Section 5.3, Unknown and Missing Characters for related topics.

116デフォルトの名無しさん2019/01/15(火) 18:43:18.89ID:cLBK0jiu
>>115
sorry Japanese only please

117デフォルトの名無しさん2019/01/15(火) 20:15:36.54ID:XDACXjEE
>>116
なんで卑屈なの?

118デフォルトの名無しさん2019/01/16(水) 11:07:49.88ID:vTKVQdGX
朝鮮人クオリティ

119デフォルトの名無しさん2019/01/17(木) 14:01:24.86ID:yxSqAYIN
消えゆく「黒電話」マーク…時代とともに変化
https://www.sankei.com/premium/news/190117/prm1901170009-n1.html

120デフォルトの名無しさん2019/01/17(木) 14:27:36.24ID:fAu7Qwle
一方、保存ボタンには相変わらずフロッピー��

121デフォルトの名無しさん2019/01/17(木) 21:08:16.21ID:rro3H2AR
今はこうですよ
文字コード総合スレ Part12 	->画像>17枚

122デフォルトの名無しさん2019/01/17(木) 21:10:53.89ID:1NGaj4L3
ダウンロードかな

123デフォルトの名無しさん2019/01/18(金) 04:13:25.86ID:6U5tZjv3



の方が合ってると思うけど
現実は


下載

124デフォルトの名無しさん2019/01/18(金) 15:39:10.11ID:XYduBDiM
直訳かよ

125デフォルトの名無しさん2019/01/19(土) 00:58:09.98ID:cLBGydY8
>>115
これ使われてるの?

126デフォルトの名無しさん2019/01/19(土) 01:02:48.22ID:TqFwYkHH
使われてるよ

127デフォルトの名無しさん2019/01/20(日) 06:25:45.86ID:kFywruI2
>>115
んーつまり基本的にはU+FFFDを使っとけばいいのかな。
マジで英語が読めんので当てずっぽうだがw

128デフォルトの名無しさん2019/01/20(日) 19:36:07.54ID:GM/wkhUD
FFFC はオブジェクト用。変換のときに絵でも音楽でも写真でも、主に文字以外のものが埋め込まれていた場合用。
FFFD は文字用。変換のときに他の文字コードでは表現できる文字がユニコードでは表現できなかった場合用。

1291272019/01/21(月) 07:51:07.97ID:uncS2Ppy
>>128
なるほど「オブジェクト」ってそういう意味か!
ありがとう。
つまり基本的に(Unicode環境で)「文字化け」した場合は
U+FFFCを目にすることはない訳だ。
(Webブラウザなら画像は別の形で表示されるし
端末なら8bitキャラクタの集合としてU+FFFDが使われるし)

130デフォルトの名無しさん2019/01/21(月) 10:29:40.20ID:z/MdI8Lw
そもそも外部に公開するドキュメントにU+FFFC,U+FFFDが存在すべきでないということでは。
アプリケーションが内部で使ってよい領域という意味と受け取ったわ。

131 ◆QZaw55cn4c 2019/01/22(火) 01:05:00.00ID:zFHfz07h
漢字コードのことでわからなくなりましたので質問いたします。
よろしくお願いいたします。

https://pc.watch.impress.co.jp/docs/column/config/1158344.html
>文字データをシフトJISではなく、Unicodeで保存するとどんないいことがあるのか。
>たとえばUnicodeならあらゆる言語の文字を混在させることができる。
>Wordでしか文書を書かないエンドユーザーにはそんなこと当たり前じゃないかと言われそうだが、

これって本当ですか?

私見では日本語の漢字と中国語の漢字を同一文書にて同時に表示できないし混在もできない、と思っていたんですが…。
CJK 漢字統合の影響はもう過去の話になってしまったんでしょうか?

132デフォルトの名無しさん2019/01/22(火) 02:31:06.16ID:leGefjnc
字体とか書体を文字としてどう考えるか、で答えが変わるだろ

133 ◆QZaw55cn4c 2019/01/22(火) 02:34:15.81ID:zFHfz07h
>>132
現に存在するUTF-32/UTF-8 という文字コードの集合を使用した場合に日本語と中国語の漢字を
@:同一文書に含ませることは可能でしょうか?A:@が可能であったとして、PC の画面にて同時に表示することは可能でしょうか?

134デフォルトの名無しさん2019/01/22(火) 02:59:07.23ID:leGefjnc
どっちも可能

135デフォルトの名無しさん2019/01/22(火) 07:59:46.55ID:Um5Ij+zI
新しめのブラウザでUTF-8の文書を書いて、中国圏の自体にしたい文字を
<span lang="zh">
みたいに指定してやると全く同じコードポイントでも違う字形になる。

136デフォルトの名無しさん2019/01/22(火) 13:07:54.27ID:/wbMKv3O
>>131
こいつはプログラマじゃないからな
かなり適当な理解で記事描くな

137デフォルトの名無しさん2019/01/22(火) 14:56:00.21ID:SJtsjRub
>>131
Unicodeは全世界の文字に対応した文字コード
混在して使えるのは当たり前

138デフォルトの名無しさん2019/01/22(火) 23:10:13.56ID:MZI8yiK5
>>133
より正確に言えば、
保存するときにローカルの文字コードに変換してるソフトかもしれないのでそのソフトの仕様による
例えば英文フォントしかないPCだと漢字は表示できないだろうから表示できるかどうかは環境による
だろう

>>131
あらゆる言語とは言うけど、縄文時代の日本語を混在させるのは無理だと思うがなあ

139デフォルトの名無しさん2019/01/23(水) 08:37:00.98ID:bn3mLL6F
>131
私?では日本?の?字と中国?の?字を同一文?にて同?に表示できるし混在もできるが。

140デフォルトの名無しさん2019/01/23(水) 08:38:04.03ID:bn3mLL6F
あちゃー。unicode文字が全部?になってしまった。

141デフォルトの名無しさん2019/01/23(水) 12:18:22.13ID:djVGMpuO
>>138
> あらゆる言語とは言うけど、縄文時代の日本語を混在させるのは無理だと思うがなあ
縄文時代の日本語が文字コードで表せるならばUnicodeで表せる

142デフォルトの名無しさん2019/01/23(水) 20:08:35.75ID:9uGbsXCn
>>141
文字がないのに文字コード化できるの?

143デフォルトの名無しさん2019/01/23(水) 23:59:31.81ID:einaVBCe
漂流する論点

144デフォルトの名無しさん2019/01/24(木) 10:44:11.21ID:TePOwsZ1
論点ずらしは朝鮮人のはじまり

145デフォルトの名無しさん2019/01/24(木) 14:09:11.07ID:CmuJPGgn
>>142
俺に言うな。>>138に家
縄文時代の日本語を混在できないとしたら、
それは例えば「文字がない」ことなのに、
Unicodeだから無理みたいな言い方してるんだから

146デフォルトの名無しさん2019/01/24(木) 14:37:04.33ID:YqEq6vd1
Unicodeだからできないなんて、誰も言ってないと思うのだが。
被害妄想にとりつかれた朝鮮人みたいだな。

147デフォルトの名無しさん2019/01/24(木) 14:59:51.89ID:CmuJPGgn
> あらゆる言語とは言うけど、縄文時代の日本語を混在させるのは無理だと思うがなあ

じゃ、この発言で言いたかったことは何だって言うの?
「私(>>138)は馬鹿です。」以外に何も思いつかないんだが

148デフォルトの名無しさん2019/01/24(木) 23:03:59.13ID:YqEq6vd1
>>147
>じゃ、この発言で言いたかったことは何だって言うの?

(unicodeならすべての言語を混在できるという話しを受けて)
あらゆる言語とは言うけど、縄文時代の日本語を混在させるのは無理

だろ。他に何があるってんだ?

149デフォルトの名無しさん2019/01/25(金) 11:58:11.28ID:Syn0T0uw
横からすまんが元レスをたどると>>131「あらゆる言語の文字を混在させる」だぞ。
それを>>138がしょっぱなから「あらゆる言語を文字で混在させる」に読み違えてるように思える。

150デフォルトの名無しさん2019/01/25(金) 12:36:50.26ID:EnRgcOgq
宇宙の惑星や生命体の多さから言って
UNICODEじゃ全然足りないのは明らか

151デフォルトの名無しさん2019/01/25(金) 14:50:56.20ID:fW+xzaQf
>>148
縄文時代の日本語ってなに?
参考リンク教えて

152デフォルトの名無しさん2019/01/25(金) 21:01:41.10ID:Syn0T0uw
これ誰かがわざと論点動かして遊んでるだけだな…

153デフォルトの名無しさん2019/01/25(金) 21:59:31.32ID:cTfFLjRM
>>149
だから文字のない言語は無理だろ?
という話だけなのに、なんでひねくれてるの?

154デフォルトの名無しさん2019/01/26(土) 15:18:19.02ID:yVAkGzul
>>152
朝鮮人メンタル

155デフォルトの名無しさん2019/01/26(土) 17:43:06.71ID:+ikAikUs
なぜ文字コードスレで文字の無い言語の話をしようと思ったのか

156デフォルトの名無しさん2019/01/27(日) 20:08:40.52ID:fsCM9HoX
そこに文字がないから

157デフォルトの名無しさん2019/01/28(月) 17:43:32.30ID:2/HZJEKq
win32apiスレ荒すな!

158デフォルトの名無しさん2019/01/29(火) 08:22:23.73ID:NccK+bbj
なんか旧かなキチガイと同じ臭いがする

159デフォルトの名無しさん2019/02/01(金) 11:28:25.54ID:FNQUOW/0
いきなりですが質問失礼します

とあるオンラインゲームをやってまして
そこで名前のソートの規則から、そのゲームが採用している文字コードの符号化方式を知りたいのですが
各コードにおいての文字の並びと、実際のゲーム内での文字のならびに違いがあったので素人の私にはお手上げ状態です

素人なりに6時間ほどぐぐってみたりしたのですが、それらしい符号化方式は特定できませんでした

スプレッドシートに、ゲーム内で実際にソートされていた文字を順番も合わせてまとめました
文字コードや符号化のスペシャリストのみなさんにこれを見てもらって、一番近い符号化方式をお教えいただけたらうれしいです

文字ソートまとめ、上から下に向かって昇順になっています
https://docs.google.com/spreadsheets/d/1QbN1zHY8BLnUampdKYVIRzK34SrTdq2gkMBgct03Fu8/edit?usp=sharing

それではよろしくお願いします

160デフォルトの名無しさん2019/02/01(金) 11:40:45.63ID:FNQUOW/0
このサイトを参考に文字コード引っ張って来てみました
http://ash.jp/code/unitbl21.htm

区 点 JIS SJIS EUC UTF-8 UTF-16 字

01 86 2176 8196 A1F6 EFBC8A FF0A *
84 06 7426 EAA4 F4A6 E78699 7199 熙
17 77 316D 898D B1ED E78795 71D5 燕
44 80 4C70 96EE CCF0 E79FA2 77E2 矢
27 71 3B67 8E87 BBE7 E7B4AB 7D2B 紫
01 49 2151 8170 A1D1 EFBD9D FF5D }

ゲーム内では熙 燕 矢 紫の順にソートされており
引っ張ってきた文字コードを見ると、数字と文字のソート関係が昇順で一致していたのがUTF-8かUTF-16だったので
その2つかな?と思ったのですが、実際にそれらの符号化のサイトを見てみたら、ゲーム内のソートとはまた違う規則性のようでした

実験として、符号化の一番値の大きい文字である「FF5D }」を文字として使ってみたところ
先の4つの漢字の下にソートされたのでUTFあたりが近そうなのですが、それ以上は素人にはわからないので困ってしまっている状況です。
どうかご助言の方なにとぞよろしくお願いします。

161デフォルトの名無しさん2019/02/01(金) 13:28:31.64ID:OoI2nX80
区別しない文字があるんだから文字コード外のルールでソートされてるんだろ
特定の符号化を示唆する特徴が見られたとしてもそれは実際に採用されてる符号化と直接の関係がない

162デフォルトの名無しさん2019/02/01(金) 14:36:54.05ID:5sjBS9D2
StrCmpLogicalWとか知らなそう?

163デフォルトの名無しさん2019/02/01(金) 18:36:04.25ID:FNQUOW/0
回答ありがとうございます
本当に助かります

>>161
あーそういう感じですか・・・
ってことは自分で調査しないとだめそうですね
返答ありがとうございました

>>162
ほとんど初心者なので知りませんでした こういう関数があるんですね
専門用語とかだけでも出してもらえて嬉しいです
何も知らないのでぐぐる事もできなかったので助かります


単語さえわかればあとはこちらで調べますので
他にも関連した情報がありましたら用語だけでも教えてもらえると嬉しいです

164デフォルトの名無しさん2019/02/01(金) 19:29:42.41ID:GHV5J4t+
Unicode(UTF-8, UTF-16)はコードポイント順とは別にソート順のデータが定義されてるんだけど
記号類がアルファベットの前に来るってのはそれっぽいような
http://www.unicode.org/Public/UCA/latest/allkeys.txt

でも〆の位置は明らかに違うなぁ

165デフォルトの名無しさん2019/02/01(金) 22:48:31.77ID:UXXgl86T
>>161
ほんそれ

166デフォルトの名無しさん2019/02/01(金) 23:10:01.58ID:1OLKpSdz
例えば韓国製のゲームなら韓国語での文字コード順になってるかもな

データベースにMySQLを使ってるかもしれないという前提だと
MySQLでのソート順序はCollationという

http://variable.jp/2009/07/14/mysql-collation/
> MySQL5.0では,126種類でMySQL5.1では,127種類のCollationが用意されている。
> 一つの文字コードに複数のCollationが用意されていて、文字データの場合,文字コードによって,
> 並びが変化する。

127種類のうちUTF8系だけで21種類の順番が存在する

167デフォルトの名無しさん2019/02/04(月) 15:09:00.52ID:ipefWero
中国製なら中文系かもな。「Big5」とか「CNS11643(EUC_TW)」とか、「GB2312(EUC_CN)」とか。

168デフォルトの名無しさん2019/02/05(火) 19:23:22.90ID:9Z2hbdGL
日本製でもCO-59とかの可能性がある。

169デフォルトの名無しさん2019/02/06(水) 14:24:15.52ID:r9SYyl7G

170デフォルトの名無しさん2019/02/06(水) 15:28:47.74ID:kcXvzDdu
絵文字ちゃうやん
ただの絵

171デフォルトの名無しさん2019/02/06(水) 21:57:35.71ID:/jZJbKDa
>>169
ブリックパックの右二つがなんだかわからない

172デフォルトの名無しさん2019/02/07(木) 00:13:13.64ID:XGqZMSaR
だんだんレゴみたいになってきたな

173デフォルトの名無しさん2019/02/07(木) 18:52:35.59ID:rnocbaU8
>>171
南アの飲み物マテと牡蠣じゃねーの

174デフォルトの名無しさん2019/02/08(金) 04:31:41.05ID:6HMnnMCZ
なんか真珠できてない?

175デフォルトの名無しさん2019/02/08(金) 19:56:39.86ID:oJ2kcRDW
真珠を絵に入れるなら pearl oyster にしとけばいいのに

176デフォルトの名無しさん2019/02/09(土) 15:36:03.22ID:3lTArmdf
>>110
SSIDって英数字だけじゃないの?

177デフォルトの名無しさん2019/02/09(土) 16:49:37.43ID:UMSUoHVI
>>176
ほとんどのルーターで禁止されているけど、ルーターのWebUIでSSIDを設定する時に
JavaScriptの文字列チェックを外して強引にUTF-8で設定させるのが一部で流行っているらしい。

178デフォルトの名無しさん2019/02/10(日) 00:42:00.71ID:katisOGx
内部UTF-8なの?

179デフォルトの名無しさん2019/02/10(日) 00:57:47.38ID:nr+SJD/m
内部では単なるヌル終端のバイト列として扱ってるだけなんだろう

180デフォルトの名無しさん2019/02/10(日) 15:54:10.44ID:PXpe84p+
無理やり設定しても繋げられなくなる気がする

181デフォルトの名無しさん2019/02/10(日) 19:57:18.23ID:MigChu0H
💩
うんこ
🍭
あめ

182デフォルトの名無しさん2019/02/10(日) 20:01:32.56ID:MigChu0H
🍭
あめ


183デフォルトの名無しさん2019/02/10(日) 22:34:53.92ID:Amp5CTrh
>>180
見えているのに到達できない場所みたいだな

184デフォルトの名無しさん2019/02/10(日) 23:37:08.37ID:/Ok9Y0Js
ユニコードの文字の説明(#から右の部分)がのっているテキストファイルの置き場所って
どこかわかります。できれば、日本語だけでなく全文字が欲しい。

↓こんなやつがずらっと。
0x878D U+337E # SQUARE ERA NAME MEIZI [2000]

185デフォルトの名無しさん2019/02/10(日) 23:45:31.96ID:/Ok9Y0Js
https://unicode.org/Public/MAPPINGS/
ここは知っています。

186デフォルトの名無しさん2019/02/11(月) 18:36:04.22ID:QUwqB+eg
そこ知ってるならもう辿り着けたも同然なのに
一つ上がってみよう

187デフォルトの名無しさん2019/02/12(火) 17:07:51.47ID:uPzbFBNW
一昔前に、大塩平八郎のLANや応仁のLANというSSIDが話題になったことがあるよね。
俺は見たこと無くて何とも言えないのだけど、実際に接続できたのだろうか?

188デフォルトの名無しさん2019/02/14(木) 19:27:45.79ID:Ny/2bQvT
文字化け先生はなんかあったのか

189デフォルトの名無しさん2019/02/14(木) 21:24:21.21ID:sLL+4j00
境界判定するつもりが教会判定することになり異端審問にかけられた。

190デフォルトの名無しさん2019/02/15(金) 10:47:46.35ID:9AJYray/
Nobody expects the Spanish Inquisition!

191 ◆QZaw55cn4c 2019/02/15(金) 21:47:29.13ID:8MeM2Ami
>>190
Nobody knows the trouble i've seen, nobody knows but Jesus!

192デフォルトの名無しさん2019/02/23(土) 21:24:43.04ID:nqqF93LL
https://unicode.org/cldr/utility/character.jsp?a=1D00
↑ここにアクセスしても空白のページが表示されるだけなんだけど
みなさんもそう?

前までは確かに存在したページの筈……。

193デフォルトの名無しさん2019/02/24(日) 11:44:00.18ID:A1cNJX+Z
確かに空白だな、と思ってソース見たらtofuが並んでた

194デフォルトの名無しさん2019/02/24(日) 14:46:38.10ID:YwY0sV++
Service Temporarily Unavailable

195デフォルトの名無しさん2019/02/24(日) 17:25:45.84ID:Nokppl90
そうか…
あのページはすごい便利に使わしてもらってたのに、利用できないとは残念

196デフォルトの名無しさん2019/02/25(月) 10:45:27.39ID:Opp/wdL5
>>192 がトドメ刺したんか

197デフォルトの名無しさん2019/02/25(月) 10:51:17.50ID:Opp/wdL5

198デフォルトの名無しさん2019/02/27(水) 18:11:26.22ID:NPiQGjbt
>>197
そのページから個々の文字に関する情報って見れなくね?

199デフォルトの名無しさん2019/03/06(水) 23:53:15.90ID:3quF+PLE
unicode 12.0 出てた

200デフォルトの名無しさん2019/03/07(木) 07:31:58.41ID:T3odpijK
>>199
unicode、すっかりグダグダたな。なんだよ絵文字って。

201デフォルトの名無しさん2019/03/07(木) 08:59:33.50ID:6IyvIIuW

202デフォルトの名無しさん2019/03/07(木) 11:12:32.47ID:MaxgRiSY
仕事する馬鹿ほど面倒なものはない

203デフォルトの名無しさん2019/03/07(木) 20:32:36.31ID:2TYLONzR
U+32ffにはplaceholderも入れてないのか

204デフォルトの名無しさん2019/03/08(金) 07:46:36.72ID:IGi7MMC9
>>201
「ゑ」の小さい字もできるんだ、
「ぇ」みたいに。

205デフォルトの名無しさん2019/03/08(金) 14:51:06.96ID:uMMKH+w1

206デフォルトの名無しさん2019/03/08(金) 18:46:01.42ID:soybuSeV
その読みにくい文体、中学のマイコン部の先輩が部誌に書いてたコラムに似てるなと思った

207デフォルトの名無しさん2019/03/08(金) 18:58:34.86ID:8O+4MLhG
内容はともかく

> それに、今みたいなポリコレ棒が猛威を振るう時代だったら、CJK統合は行われなかったでしょうね。
> 部外者が他文化の文字に対してもの申す事は、文化への攻撃・侵害・侵略として糾弾されたでしょうから。
> 日本人や中国人側からではなく、米国や欧州の国々の方から強い反対が出たでしょう。
<https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b#comment-ba92e82cf5ff8a829c10>

↑これはなるほどと思った。政治的正当性についてとやかく言うつもりはないが
CJK統合はマジでそのCJK文化圏にいる利用者からは扱いずらすぎるからな……。
「意味や字形が似ている文字なら同じ符号を割り当てていい」のなら,
フラクツゥールを態々用意せずに,lang=de-x-Frakみたいな指定があったときに
文字「A」を「𝔄」という字形で表示すればいいのに,そうしてない。

208デフォルトの名無しさん2019/03/08(金) 19:17:05.59ID:orP5LHkV
苦情が出た時のために拡張領域があるんだから許してあげてよ。

209デフォルトの名無しさん2019/03/08(金) 20:40:25.47ID:9ZplOVC2
小さいゐゑヰヱは "used to write archaic Japanese" なんだけど
小さいヲンは実は典拠が微妙
同じワ行音ってことで何となく入っちゃった

210デフォルトの名無しさん2019/03/08(金) 20:41:24.22ID:9ZplOVC2
同じってのはヲの方だけど

211デフォルトの名無しさん2019/03/08(金) 22:42:36.27ID:orP5LHkV
リンゴロゴ(U+F8FF)を使った Tim  が正しく表示される環境は限定的なのかな?

私は「ティム・アップル」 トランプ氏言い間違えに本人が便乗
https://www.afpbb.com/articles/-/3214744
 【3月8日 AFP】米アップル(Apple)のティム・クック(Tim Cook)最高経営責任者(CEO)は7日、
 ドナルド・トランプ(Donald Trump)米大統領に名前を呼び間違えられたことを受け、
 公式ツイッター(Twitter)アカウントの名前を「ティム・アップル」に変更した。

 トランプ氏は6日、ホワイトハウス(White House)で開かれた会合で、
 アップルの国内投資と雇用創出について感謝の意を述べた際、クック氏を「ティム・アップル」と呼び、ツイッター上で話題を呼んだ。

 するとクック氏は翌朝、これに便乗し、自身のツイッターの表示名を「ティム」の後にアップルのロゴをつけたものに変更。
 ツイッターユーザーからは、米マイクロソフト(Microsoft)共同創業者のビル・ゲイツ(Bill Gates)氏を
 「ビル・マイクロソフト」、米電気自動車(EV)大手テスラ(Tesla)のイーロン・マスク(Elon Musk)最高経営責任者(CEO)を
 「イーロン・テスラ」、初代米大統領のジョージ・ワシントン(George Washington)を
 「ジョージ・アメリカ」と呼んだらどうかといったトランプ氏への提案も飛び出した。

 ヒラリー・クリントン(Hillary Clinton)元米国務長官を「Crooked Hillary(歪んだヒラリー)」と呼ぶなど、
 ニックネームを生み出してきたことで知られるトランプ氏は、過去にも同じような言い間違えをしている。
 昨年には、米航空防衛大手ロッキード・マーチン(Lockheed Martin)のマリリン・ヒューソン(Marillyn Hewson)CEOを「マリリン・ロッキード」と紹介した。
(c)AFP


ティム・クック氏のツイッター・アカウント
https://twitter.com/tim_cook
https://twitter.com/5chan_nel (5ch newer account)

212デフォルトの名無しさん2019/03/08(金) 23:59:07.12ID:AN9FdtGs
Private Use Area を公にさらす変態

213デフォルトの名無しさん2019/03/09(土) 00:06:34.07ID:bJz0o3uK
私用領域U+E50Aが渋谷109の絵文字に割り当てられているツイッターさんの前でも同じこと言えんの?
https://twitter.com/muota_here/status/657111322656555008
https://twitter.com/5chan_nel (5ch newer account)

214デフォルトの名無しさん2019/03/09(土) 03:14:15.24ID:JZDf7HgY
Tim Appleと呼ばれたTim Cook、Tim Tofuを名乗る。

215デフォルトの名無しさん2019/03/09(土) 07:26:47.29ID:ZOfzHyh2
>>207
>CJK文化圏にいる利用者からは扱いずらすぎる

わざとそれを狙って毒撒いたんじゃね?

216デフォルトの名無しさん2019/03/09(土) 07:28:53.38ID:JheZ4dDX
>>207
ぁたιゎゆるさナょぃ

217デフォルトの名無しさん2019/03/09(土) 20:48:52.13ID:3uujbs1q
>>192
http://www.unicode.org/cldr/utility/character.jsp?a=9AD9

使えるように直ったっぽいよ。

218デフォルトの名無しさん2019/03/10(日) 00:01:29.10ID:cA8Bnujj
>>216
「あたしわゆる」の後なんて書いてあるの?

219デフォルトの名無しさん2019/03/10(日) 00:29:48.57ID:XmX8U4WX
>>218
さない
「あたしわ ゆるさない」 だろ

220デフォルトの名無しさん2019/03/10(日) 17:51:22.00ID:uFsYqTSV
>>207
長すぎてどこまで読んだか判らない

>>217
ありがとー

221デフォルトの名無しさん2019/03/11(月) 11:18:28.54ID:PmMIa9FT
>>220
>>192は俺な訳だがなぜ無関係なあなたが返事をしているんだw

222デフォルトの名無しさん2019/03/11(月) 12:16:12.73ID:tDJ/xRRJ
我は汝、汝は我。 禁断の叡智は開かれた。

223デフォルトの名無しさん2019/03/14(木) 16:59:19.77ID:ZsZ3eZF+
UAX #29: Unicode Text Segmentation
http://www.unicode.org/reports/tr29/tr29-35.html#Modifications

Unicode 12.0.0 では新しく U+FF10..U+FF19 の全角数字を数字扱いするようになったのね。
UAX #14 では Ideographic のままだし何で今頃変えたのかよく分からないけど。

224デフォルトの名無しさん2019/03/14(木) 22:33:54.00ID:+YVU0bVz
これから漢数字とか丸数字も数字扱いしだすゾォー^
属性定義するのはいいけど定義をコロコロ変えてんじゃねぇよ

225デフォルトの名無しさん2019/03/15(金) 00:54:56.25ID:h1OQ6sr0
>>223
まじかよ
互換性がとも思うけど,寧ろ便利なのかな。

226デフォルトの名無しさん2019/03/15(金) 06:30:19.25ID:/rrmc9zm
ダブルクリックで文字列選択するような機能に影響でなければいいけどなあ
鈴木一郎が全部漢字だから一気に選択できたのに一が数字だからってんで
鈴木/一/郎なんて分けられたらやっかいだ

227デフォルトの名無しさん2019/03/15(金) 06:41:57.81ID:t7/3/Ky+
Unicodeじゃなくて個別のライブラリの仕様次第だと思うけど、近い将来影響が出てきそうだね。

228デフォルトの名無しさん2019/03/15(金) 12:06:24.49ID:JrKcPYyj
>>226
うわあ

229デフォルトの名無しさん2019/03/15(金) 12:07:15.17ID:JrKcPYyj
そういえば(今もそうかは知らないが)Firefoxは「々」がそういう選択のされ方だった。あれはなんでなんだろう。

230デフォルトの名無しさん2019/03/15(金) 14:05:00.83ID:SEjqglYP
漢数字の数字扱いまだ?

231デフォルトの名無しさん2019/03/15(金) 15:31:55.15ID:oAURdopD
そして参とか陸とかまで数字扱いされて地獄へ

232デフォルトの名無しさん2019/03/15(金) 15:39:45.46ID:a2hOwysQ
ソート順が萬>千>百>拾とかか

233デフォルトの名無しさん2019/03/15(金) 19:19:14.57ID:WyyrIOit
Unicode 11の時点で十進法表記に基づく0-9相当の文字はNumeric扱いされてたようだから
FF10..FF19は確かに漏れだな
http://www.unicode.org/Public/11.0.0/ucd/auxiliary/WordBreakProperty.txt

234デフォルトの名無しさん2019/03/15(金) 19:36:37.30ID:t7/3/Ky+
正規表現ライブラリpcreは境界判定\bや英数字判定\wの判定方法をフラグPCRE_UCPで切り替えられるようになっている。
grepの-Pオプションはpcreを使うのだけど、境界判定\bが-Eオプションと違う動きになる。PCRE_UCPオプションを使ってビルドいないからだろうと思う。

235デフォルトの名無しさん2019/03/22(金) 01:21:11.28ID:8w4+OmEG
ふむ

236デフォルトの名無しさん2019/03/23(土) 19:29:06.12ID:4GARFTFw
ふまない

237デフォルトの名無しさん2019/03/23(土) 23:02:35.35ID:GanpYc3U
ふまれたい

238デフォルトの名無しさん2019/03/24(日) 03:18:52.69ID:OrJDHzVf
フモフモ

239デフォルトの名無しさん2019/03/24(日) 11:24:12.73ID:Rpzr04ID
もふもふ

240デフォルトの名無しさん2019/03/24(日) 14:16:39.59ID:2vsRyi47
このスレかどっかでC99で作られたUnicodeライブラリの紹介を見掛けた気がするんだけど
誰か知らないですか。
確かに5ちゃんねるの文字コード関連のレスで
「---っていうライブラリが便利だよ」みたいな文章だったと思うんですけど。。。
なぜかそのとき ライブラリのWebページをブクマし忘れてて そのライブラリの名前を失念してしまったんです

241デフォルトの名無しさん2019/03/24(日) 14:32:46.63ID:DqM6OskA
過去様が卒業したとこ

242デフォルトの名無しさん2019/03/24(日) 16:01:40.15ID:4oYv+rwZ
未来様。

243デフォルトの名無しさん2019/03/27(水) 17:42:59.30ID:WhOBGSwK
ICUは有名なのですぐ見付かるだろうしなによりC99じゃない。
utf8procじゃねーの?

244デフォルトの名無しさん2019/04/01(月) 17:18:38.72ID:89NTFMVc
このスレのみんなは㋿だって先に知ってたんだな

245デフォルトの名無しさん2019/04/01(月) 20:45:19.42ID:rsPxYoMK
お前ら、システム改修の時は互換漢字もちゃんと考慮しろよ

https://twitter.com/yabuki/status/1112565487995518979
https://twitter.com/5chan_nel (5ch newer account)

246デフォルトの名無しさん2019/04/01(月) 22:00:00.14ID:SiO8nKzk
新元号発表の時の墨書、楷書体だけど「令」の字形はU+F9A8に似ていた。
何らかの揉め事になって面白い事になるかも。

247デフォルトの名無しさん2019/04/01(月) 23:51:37.27ID:PpRhn1A4
てか「人一卩」と「人丶マ」は異体字セレクタにあるけど、官房長官が掲げた「人丶卩」が無いな

248デフォルトの名無しさん2019/04/02(火) 02:25:50.36ID:v8tjfRTs
Gengo-Oshuujiコレクションを申請するときがきたか

249デフォルトの名無しさん2019/04/02(火) 07:20:09.23ID:DRYM+8L2
あのお習字も公文書扱いらしいな
汎用電子あたりにぶち込んでいいぞ

250デフォルトの名無しさん2019/04/02(火) 10:10:03.96ID:GTYTa8Tr
個人的には新元号に2004年のJISで例示字形変更された字や第2水準以下の字が使われなくて良かったと思ってる。

251デフォルトの名無しさん2019/04/02(火) 12:05:10.00ID:5+C+zQyU
>>245
そんな大事な話でFA98とF9A8間違うとか絶対わざとやってるだろ
消して投稿しなおせよ

252デフォルトの名無しさん2019/04/02(火) 12:10:05.14ID:5+C+zQyU
>>247
そもそも字が下手過ぎて習字の基本すら出来てないやろ

和にしても
ノ木口
なのに
ノ丶木口
って描かれてる

253デフォルトの名無しさん2019/04/02(火) 14:05:03.11ID:k+6mhhx+
新元号「令和」と文字コード(主にUnicode)の問題
https://togetter.com/li/1333809

254デフォルトの名無しさん2019/04/02(火) 18:12:09.33ID:ONyiz5iP
アドビのフォントが新元号「令和」に対応--2パターンの合字を追加
https://japan.cnet.com/article/35135080/

この手の合字をもっと増やしてもいいと思う。絵文字をボコボコ増やすよりも有意義だ。
㌀、㍇は既にある。ゲートウェイの合字があると面白い。
山手線の新駅の名前に使える。

255デフォルトの名無しさん2019/04/02(火) 21:47:42.61ID:qF1eZplP
集合住宅名にありがちシリーズだと㌞・㌪はあるがヒルズとかテラスとかがないな

256デフォルトの名無しさん2019/04/02(火) 23:57:38.32ID:6o2aISb6
いらんわ

257デフォルトの名無しさん2019/04/03(水) 19:17:17.44ID:1gOVHweX
Unicodeに入れるのはむりぽ
AJ1ならワンチャンあるかも

258デフォルトの名無しさん2019/04/03(水) 22:13:58.47ID:FgHYrjKu
>>250
誰でも読み書き出来る字を選ぶという配慮であろう。
令は小学4年、和は3年で習う字だ。
今時のキラキラネーム(DQNネーム)とは違う。

259デフォルトの名無しさん2019/04/03(水) 23:15:11.57ID:cN3kYbRs
常用漢字から選ぶとは最初に告知されてたが、
2010年追加の常用漢字の中には第2水準以下だったりJIS2004で字形変更されて
2点しんにょうや古い食へんの字があるよな。
教育漢字にはならなくて小学校では習わない字のままだったけど。

260デフォルトの名無しさん2019/04/04(木) 00:45:49.30ID:gljFUA1G
あの「令和」っていう習字の画像って公文書として入手できないのかな。

261デフォルトの名無しさん2019/04/04(木) 01:42:15.29ID:WKiiXHnA
習字の意味分かってる?

262デフォルトの名無しさん2019/04/04(木) 02:37:07.88ID:RbPEvSJ+
どのメーカーの半紙と墨汁を使ったか公開すればバカ売れだな

263デフォルトの名無しさん2019/04/04(木) 03:17:29.09ID:sXgQQUMv
字が下手過ぎた
やり直せ

264デフォルトの名無しさん2019/04/04(木) 08:30:46.45ID:VfgtU/Z4
https://twitter.com/yanok/status/1113052042254143489

令の字に関してなぜかU+F9A8なんて話が流れてきた。韓国KSコード由来の互換漢字。
これは『改訂新版 プログラマのための文字コード技術入門』p.110に書いたような理由で入ったものだけども、扱うことはまずないのでは。
それ言うんならU+2F24の「⼤」を使った「⼤正」は今までチェックしてたのかい?

これはUnicodeになぜか別立てで入っている康熙部首の符号位置。
https://twitter.com/5chan_nel (5ch newer account)

265デフォルトの名無しさん2019/04/04(木) 13:53:52.02ID:lQbbBBhx
リとり間違うような恥ずかしい間違いだな

266デフォルトの名無しさん2019/04/04(木) 15:25:32.68ID:c6BVWPCA
>>264
電子化された契約文書に大正の年号が使われることがないから影響もなかった。

267デフォルトの名無しさん2019/04/06(土) 15:08:14.87ID:uziyxFMz
大正時代に生まれた人なんかいくらでも電子管理の対象になりうるだろ

268デフォルトの名無しさん2019/04/06(土) 19:32:01.25ID:EXSfDg77
大正はIME類に成語として登録されてるからよっぽどでもないかぎり他の大は出てこんわね。

でも令和は現状自由変換状態で、この状況はみんなのスマホやPCが“令和対応”のものに更新されるまで当面続く。
そこに「こっちの令が正しい形」説が追い打ちをかけてきてるのが困ったところ。

269デフォルトの名無しさん2019/04/07(日) 11:42:20.44ID:8ULyWhed
じゃあ令和もIME登録したらいい,って思っちゃうのは素人考えなんですかね。

270デフォルトの名無しさん2019/04/07(日) 14:27:30.40ID:LEvc5MB9
他人のIMEに一括登録できるなら何かのプロだな。
あるいは単に問題を取り違えてる素人かもしれん。

271デフォルトの名無しさん2019/04/08(月) 00:28:20.42ID:gS267+Xj
令和
令和

272デフォルトの名無しさん2019/04/08(月) 12:50:59.09ID:mdLXKZZ1
江戸時代の地震記録した古文書495点 市民参加して解読完了!「くずし字学んだ」 2019年04月07日 06時00分 @ハザードラボ
https://www.hazardlab.jp/know/topics/detail/2/8/28696.html
文字コード総合スレ Part12 	->画像>17枚

江戸時代の古文書に記録された災害の歴史。くずし字を現代文字に直しながら読んでいくプロジェクトだ(京都大)

京都大学は、地震研究所図書室が所蔵する江戸時代の地震を記録した古文書495点の解読を終了したと発表した。

2017年1月にスタートした解読作業は、4600人を超える一般市民が参加してくずし字で書かれている古文書を、一字ずつ現代文字に活字化するという
プロジェクトで、過去の災害の歴史を学ぶきっかけにつながるという。

古代から地震が多かった日本では、『日本書紀』に残る416年の「允恭(いんぎょう)地震」を最古として、数多くの史料が残されている。しかし、解読されたのは
そのうちのほんの一部で、有益な情報のほとんどが手付かずの状態だ。

273デフォルトの名無しさん2019/04/08(月) 12:51:41.80ID:mdLXKZZ1
くずし字学習アプリを使ってゲーム感覚で学ぶ
文字コード総合スレ Part12 	->画像>17枚

翻刻が終わった『地震年代記』(国立民族博物館)

京都大学大学院の「古地震研究会」は2017年1月、東大地震研究所の図書室が所蔵する古文書495点をインターネット上に公開し、Wikipediaのように閲覧者が
現代文字に書き換えるプロジェクトを開始。これまでに4626人が登録し、このうち347人が実際に文字の入力作業に参加した結果、新書30?35冊分の文字数に
あたる465万文字が入力されたという。

「みんなで翻刻」というこのサイトには、数多くのくずし字のパターンや、江戸時代の本から収集した3000種類近い熟語が収録されており、
くずし字学習支援アプリと連携することで、初心者でもくずし字を学ぶことができる機能が備わっている。(翻刻=文字起こし)

過去の災害の歴史を学ぶきっかけに

文字コード総合スレ Part12 	->画像>17枚

学習アプリを使って、ゲーム感覚でくずし字を学ぶ

スタート当初は、地震研究所二代目所長をつとめた地震学者の石本巳四雄(みしお)氏がコレクションした114点の災害史料の翻刻を目標としていたが、
開始から5カ月後には完了。その後、資料を追加することで495点すべての作業が終わった。

今後は、ほかの資料館が所蔵する史料も登録を進め、翻刻を続ける計画なので、興味がある人は今からでも遅くない。パソコン1台あれば誰でもアクセス
できるので、ぜひ一度サイトを訪問してほしい。古文書の解読の楽しさはもちろん、自分が住んでいる地域で過去に起こった地震の歴史を学ぶこともできる。

274デフォルトの名無しさん2019/04/08(月) 12:54:44.65ID:mdLXKZZ1
みんなで翻刻
https://honkoku.org/

275デフォルトの名無しさん2019/04/09(火) 12:37:03.63ID:cLV16Pee
UTF-8って、制御コード含まれることはないんだっけか

276デフォルトの名無しさん2019/04/09(火) 13:07:46.20ID:9ML7UTJk
だぶりのコードもあるし
不正コードでおかしくなるシステムもある

277デフォルトの名無しさん2019/04/09(火) 14:29:47.00ID:KelUteYn
だぶりのわたなべさん

278デフォルトの名無しさん2019/04/09(火) 23:57:15.76ID:7iU2pxay

279デフォルトの名無しさん2019/04/13(土) 16:03:07.58ID:UCcAxlmJ
東京パラのピクトグラム発表 全22競技を絵文字で表現
https://www.asahi.com/articles/ASM4D61ZPM4DUTQP029.html
2019年4月13日11時08分

280デフォルトの名無しさん2019/04/16(火) 14:56:33.54ID:l4UDEMAP
新元号名で使用する文字コードについて(周知)
https://www.meti.go.jp/policy/it_policy/kaigen/20190405_kaigen_code.pdf

281デフォルトの名無しさん2019/04/19(金) 00:40:25.06ID:SszpXZZX
周知元年

282デフォルトの名無しさん2019/04/19(金) 00:42:08.08ID:E436SlHO
草なぎの剣って
なぎはどの字が正解?

283デフォルトの名無しさん2019/04/19(金) 00:45:03.52ID:p/ztoCUW

284デフォルトの名無しさん2019/04/19(金) 02:32:47.43ID:ixte0yp9

285デフォルトの名無しさん2019/04/19(金) 06:10:41.34ID:XxVTl/mO
草[データ欠損]の剣

286デフォルトの名無しさん2019/04/19(金) 14:43:52.39ID:K/dFwraF
wwwの件

287デフォルトの名無しさん2019/04/19(金) 15:47:39.94ID:y/MVEQAL
草なぎって芸柏lにいるよな

288デフォルトの名無しさん2019/04/20(土) 21:38:10.03ID:F8mbqA+i
>>254
Unicodeに収録されている「パーツ」と「ほか」が追加されるとUnicode仮名合字が揃うから最優先

289デフォルトの名無しさん2019/04/21(日) 01:51:55.93ID:ojSCyBaB
タイ行きたくなってきた

290デフォルトの名無しさん2019/04/21(日) 01:54:55.60ID:x0mJ9C0y
お?GoGoか?それともMP?w

291デフォルトの名無しさん2019/04/21(日) 13:49:25.89ID:tITQ2Bq3
>>254
これ使えって言われそうだ
&#x1f1ec;&#x1f1fc;

292デフォルトの名無しさん2019/04/21(日) 17:44:13.32ID:sl+JTl2l
どれや

293デフォルトの名無しさん2019/04/21(日) 23:16:48.91ID:oi8OpLnl
ψ

294デフォルトの名無しさん2019/04/21(日) 23:28:17.18ID:sMtprdSr
>>291
GW?

295デフォルトの名無しさん2019/04/21(日) 23:34:13.27ID:Ac4MsT8t
>>293
ソ連の旗に書いてあるやつ?

296デフォルトの名無しさん2019/04/22(月) 02:38:56.56ID:V0Ep5EOp
鋤?

297デフォルトの名無しさん2019/04/22(月) 03:12:27.93ID:3Wv0MOni
>>296
見ているとゲシュタポ崩壊してくる

298デフォルトの名無しさん2019/04/22(月) 04:58:25.98ID:K/a5X4tg
屮屮

299デフォルトの名無しさん2019/04/22(月) 06:48:42.73ID:LkdKQQlY

300デフォルトの名無しさん2019/04/22(月) 21:46:31.50ID:KyfckjPA

301デフォルトの名無しさん2019/04/22(月) 23:13:49.10ID:7Lb1KZDb
草ァ!

302デフォルトの名無しさん2019/04/26(金) 15:10:00.86ID:h/0smdVx
役所から『楷書体の“令和”の“令”の“マ”を明朝体のように縦棒に直せ』と指示がきた「どっちでもいいはずでは」
https://togetter.com/li/1341711

303デフォルトの名無しさん2019/04/26(金) 16:10:02.69ID:ICRz1tVq
これ結果的に包摂への理解が世間に広がれるきっかけになればいいなあ

304デフォルトの名無しさん2019/04/26(金) 17:26:05.43ID:kg5yc1Gc
令の下はアベのアが正しいと閣議決定

305デフォルトの名無しさん2019/04/26(金) 20:07:56.08ID:vOVYhDJF
あそうのアと聞いたが

306デフォルトの名無しさん2019/04/26(金) 21:07:22.44ID:zkZoCC1n
昭和天皇「あっそう」

307デフォルトの名無しさん2019/04/30(火) 00:24:58.84ID:fTPg0Gzh
準備は万全でしょうか?

308デフォルトの名無しさん2019/04/30(火) 02:48:38.56ID:qV7WSa+K
一応アプデして再起動した
https://support.microsoft.com/ja-jp/help/4493453/windows-7-update-kb4493453
いつでも来やがれ

309デフォルトの名無しさん2019/04/30(火) 03:08:50.84ID:SjzICe9T
影響なんぞあるかなあ?

310デフォルトの名無しさん2019/04/30(火) 10:48:06.61ID:O+RhbMFB
もし見える環境なら
これ


らしい

311デフォルトの名無しさん2019/04/30(火) 10:51:51.20ID:M/y36yih
裏向きですよ官房長官

312デフォルトの名無しさん2019/04/30(火) 19:08:38.83ID:mmURSAfG
理屈と軟膏はどこにでも付くなw

313デフォルトの名無しさん2019/05/01(水) 00:10:53.03ID:Cxjz7JYJ
皆さまご無事ですか?

314デフォルトの名無しさん2019/05/01(水) 03:27:20.94ID:zkmvQa1R
応答がありませんね…

315デフォルトの名無しさん2019/05/01(水) 16:53:36.94ID:qjSscuuh
Unicode、~ のように一文字版の令和を追加
http://2chb.net/r/news/1556695686/

316デフォルトの名無しさん2019/05/01(水) 19:22:56.99ID:PSa6BJih
元号合字はBCだと思ってたのに
新しく増やす余地があるのなら慶応以前のもないと気持ち悪いなあ
保元とか平治とかちょうだいよ

317デフォルトの名無しさん2019/05/02(木) 02:19:04.44ID:oFArPNDY
ツイッターのオリジナル令和絵文字
文字コード総合スレ Part12 	->画像>17枚

318デフォルトの名無しさん2019/05/02(木) 02:56:54.78ID:fwW+HFuA
官房長官が額縁を掲げたという先例をそのまま踏襲したことにより、
将来にわたる日本の改元時儀式が爆誕した瞬間である

319デフォルトの名無しさん2019/05/02(木) 23:10:42.85ID:/beTzGTL
~みたいなのってNECの外字由来じゃなかったっけ
なんで今さらシフトJIS時代の遺物の仲間みたいなものを増やすんだか

320デフォルトの名無しさん2019/05/02(木) 23:35:48.89ID:I+5xWFxb
「シフトJIS時代の遺物」に依存している人が少なからずいて、その人たちが令和のも作られるのを望んだんだろ

321デフォルトの名無しさん2019/05/02(木) 23:45:38.82ID:7n99qwI2
つってもシフトJIS時代の遺物アプリケーションでは使えないんだぞ。なんだそれ。

322デフォルトの名無しさん2019/05/03(金) 00:00:56.27ID:wXDfhaGQ
>>321
それで使えなくてもかまわないんだろ

323デフォルトの名無しさん2019/05/03(金) 00:03:09.80ID:97u3Xpxh
世の中の大部分のワープロソフトはunicode対応済みだからSJIS縛りはない。

324デフォルトの名無しさん2019/05/03(金) 08:59:56.88ID:zgghhlv4
U+32FFのスポンサーになるやつおらんの
http://unicode.org/consortium/adopted-characters.html

325デフォルトの名無しさん2019/05/03(金) 14:14:26.24ID:/bmAVHAq
>>319
IT技術者なら使わないけど、変換候補に出でくるものを使うのがなぜいけないのかと思うのが世の中の大半。

326デフォルトの名無しさん2019/05/03(金) 14:38:44.99ID:22DEOz6X
>>324
面白いお小遣い稼ぎだなと思ったが、
これ名前に主義主張とか入れて来る人がいたらややこしいことになりそうやな。

327デフォルトの名無しさん2019/05/03(金) 14:42:17.77ID:3Vz/qKoh
>>325
別に使っても良いと思うけど
それなら慶應より前のが全部入れろと
たかだか有限個なんだし楽勝だろ

328デフォルトの名無しさん2019/05/03(金) 14:46:59.15ID:Q171sR7D
>>327
入れるのを望む人が少ないから入らないんだろ

329デフォルトの名無しさん2019/05/04(土) 10:55:56.42ID:mtwbaS1U

330デフォルトの名無しさん2019/05/04(土) 20:44:56.14ID:Hwt49Fxi
令和対応のWindows Updateは適用しないでください
https://osdn.net/projects/kancollesniffer/news/26014

331デフォルトの名無しさん2019/05/05(日) 09:10:16.53ID:vN64IIVG
>>330
MS UI Gothicは等幅フォントだったのか

332デフォルトの名無しさん2019/05/05(日) 14:06:52.01ID:a/tGSf18
仮に慶応以前も入れるとしたらさすがにBMP外だろうな。

333デフォルトの名無しさん2019/05/05(日) 15:38:00.22ID:vTdWYBgo
>>330
ワロヌ

334デフォルトの名無しさん2019/05/05(日) 15:55:58.30ID:9Ygu+RTn
>>330
自分の設計ミスじゃねーかw

335デフォルトの名無しさん2019/05/05(日) 16:30:52.35ID:O86syOAN
GW入る前からそういう話を聞いてたけど
https://twitter.com/u_1mu/status/1122083801662803968
https://twitter.com/5chan_nel (5ch newer account)

336デフォルトの名無しさん2019/05/05(日) 16:49:51.40ID:2d0rYk3C
まあDLLバージョン非互換地獄みたいなのと根は同じと考えれば大変だなと思う

337デフォルトの名無しさん2019/05/05(日) 19:01:34.13ID:McO+DcFw
おそらく今世紀半ば頃になるだろう令和の次以降も組み文字入れるつもりなのだろうか?

338デフォルトの名無しさん2019/05/05(日) 20:35:38.58ID:l5IfNH0H
不思議なもんで平成31年がはるか昔のように感じられる。

339デフォルトの名無しさん2019/05/05(日) 21:59:40.84ID:i5vkPu2K
>>335
「?」を使って無くても不具合起きるってことか
Windows Form 使ってるところはヤバいんじゃないか

340デフォルトの名無しさん2019/05/05(日) 23:33:12.08ID:afKxHVhL
>>339
問題が出るのがWinFormsだけとは限らない(少なくともExcelは確実に再現する)らしいから
GW明けには大問題になりそうな気がするんだけど、いまのところ全然そんな話になってないのがちょっと怖い

まさか「令和」の合字を付け足すだけのWindowsUpdateで
フォント幅の定義が勝手に変更されるなんて思わないよな・・・・
不幸中の幸いは「Microsoftがやらかしたことなんで開発側も被害者です」と言い張れることか

341デフォルトの名無しさん2019/05/06(月) 00:01:39.11ID:Y5VmjYQ0
勝手に見た目が変わってしまうのは迷惑と言えば迷惑だけど、それが問題かというと
大半はそうでもないんでない?スマホアプリほど表示サイズにシビアでもないだろうし。

342デフォルトの名無しさん2019/05/06(月) 00:09:47.64ID:6izbbc1p
>>341
Excel書類とかメッチャシビアじゃん
業務アプリ系もヤバいと思うよ

343デフォルトの名無しさん2019/05/06(月) 00:27:47.76ID:Y5VmjYQ0
印刷フォームのレイアウトが崩れたりとかはあるかな。
ただまぁ、印刷用フォントにUI Gothic使ってたりしたらそれ自体バグと言っていいかもしれない。

344デフォルトの名無しさん2019/05/06(月) 19:57:45.87ID:o0+2Jvom
Excelの罫線で帳票造って印刷してるところは阿鼻叫喚だなω

345デフォルトの名無しさん2019/05/06(月) 20:29:59.74ID:Ao47xCvU
なんだかな感がありつつもさすがに影響でかいから修正すると思うけど、
ユーザー側が最新に合わせて調整し終えたところで修正が入って再阿鼻叫喚ありそう

346デフォルトの名無しさん2019/05/06(月) 23:24:02.94ID:w/vwmWEJ
そもそもExcelの印刷機能はプリンタが変わっただけで文字切れする

347デフォルトの名無しさん2019/05/06(月) 23:43:52.79ID:lqbkXOHI
レイアウトが崩れても見なくなる部分がなければ最悪なんとかなるけど
切れて見えなくなる部分で影響が有ると嫌だな
自分は余裕を持たせる事が多いけど
やたらピッタリにしろ
っていう圧力が強いんだよなぁ

348デフォルトの名無しさん2019/05/07(火) 02:19:33.96ID:GL9QN5WP
知らないんだけどExcelってフォント埋め込みできないの?

349デフォルトの名無しさん2019/05/07(火) 11:57:21.14ID:33OoCrhk
WYSIWYG ってどこ行ったん

350デフォルトの名無しさん2019/05/08(水) 12:24:09.58ID:edc8315b
The Unicode Blog: Unicode Version 12.1 released in support of the Reiwa Era
http://blog.unicode.org/2019/05/unicode-12-1-en.html
The Unicode Blog: Unicode コンソーシアムは「令和」をサポートする Unicode 12.1 を正式リリースしました
http://blog.unicode.org/2019/05/unicode-12-1-jp.html
Unicode 12.1.0
http://www.unicode.org/versions/Unicode12.1.0/

Unicode 12.1.0キター

351デフォルトの名無しさん2019/05/08(水) 12:34:08.70ID:EI+Yt2nX
令和は入れて金正恩は入れないのはダブスタじゃないんですか

352デフォルトの名無しさん2019/05/08(水) 14:17:35.02ID:Y9Xu92ZN
そちらの事情詳しくないんだけど最新版ではじょんうんもコード振られてるの?

353デフォルトの名無しさん2019/05/08(水) 16:59:08.16ID:hW7QTTE+
2011年に改訂されて三代目の文字が追加されたと言われているな。
去年L2に文書が出てた。

http://www.unicode.org/L2/L2018/18011-info-kps9566-2011.pdf

354デフォルトの名無しさん2019/05/08(水) 17:50:08.89ID:+GcC1zVN
いきなり?で草
外に向けて公式発表とかはしてないのか

355デフォルトの名無しさん2019/05/08(水) 19:23:31.67ID:D1yI4PRN
令和の合字(U+32FF)は結局シフトJIS環境では使えないし、
まだこれを含むフォントがインストールされてなく表示出来ない事がある環境依存文字だから使うなとか
そもそも互換文字だから使うな、「令」(U+4EE4)と「和」(U+548C)を並べて書けとか言われるんやろ

356デフォルトの名無しさん2019/05/08(水) 23:41:31.32ID:g6pGEhqR
どうせ、利用するフォントによって、どの文字まで表示できるか?決まるんだから
変な文字は使わず、90年までの規格で止めとくほうが正解かもね。

357デフォルトの名無しさん2019/05/09(木) 12:49:52.00ID:MGsavNMK
今回はそういう話じゃないぞ

358デフォルトの名無しさん2019/05/09(木) 23:57:50.74ID:2Upif9A1
令和組み文字はCP932には入れないようだが、
JISX0213には入れるのだろうか?

359デフォルトの名無しさん2019/05/10(金) 00:24:53.97ID:jEyv0NCa
つーかそろそろ日本工業規格も令和に対応すべきだと思うのだが。
JIX X 0213だけじゃなくてJIS X 0301とかも。

360デフォルトの名無しさん2019/05/10(金) 08:46:20.50ID:ObISzXw3
CP932に追加は無いだろうけど最近の過去互換の軽視ぷりからするとやらかす可能性が完全0じゃないのが怖い

361デフォルトの名無しさん2019/05/10(金) 10:21:33.96ID:6UVTgwma
半角カタカナも滅べば良いし
年号の合字も無限に増やすのは無理だから
常に二文字表記で文字幅で調整すれば良い
天皇陛下万歳
千代に八千代に

362デフォルトの名無しさん2019/05/10(金) 14:53:16.98ID:CKiiAb8j
Android Qに絵文字64種類が追加。うち53種類が男女区別あいまいな人物のデザイン
https://japanese.engadget.com/2019/05/09/android-q-64-53/

363デフォルトの名無しさん2019/05/10(金) 18:18:29.29ID:mVkH2fqp
das emoji

364デフォルトの名無しさん2019/05/11(土) 22:48:01.24ID:+ReHs7Ms
絵文字とかと同じ 令[ZWJ]和 でいいのにな
専用の文字コードが必要なのかと

365デフォルトの名無しさん2019/05/12(日) 01:19:24.51ID:ki3sPmcj
漢字のジョイントって意図が不明瞭にならないか?
偏旁に配置した新字を創字したいのかなと思ってしまう

366デフォルトの名無しさん2019/05/12(日) 13:36:08.25ID:VATOmp33
ほとんど見掛けないけど漢字位置記述文字みたいなの使えば?

367デフォルトの名無しさん2019/05/12(日) 16:00:08.02ID:Pj0ORKPL
あれは人間への説明用であって合成して表示させるものじゃないから違うような

> the reader can then create a mental picture of the ideographs from the description.

> In particular, support for the characters in the Ideographic Description block does not require the rendering engine to recreate the graphic appearance of the described character.

368デフォルトの名無しさん2019/05/12(日) 19:33:59.77ID:VATOmp33
あ,そうなのか。
あれを適切に設定すれば,対応したビューアで自由に漢字が表現できるもんだとばかり……。
教えてくれてありがとう。

369デフォルトの名無しさん2019/05/12(日) 21:21:35.48ID:3Fo18FOg
あれだと縦書きと横書きで並び変えられないしね
欲しいのは組み文字ジョインター

キ[KMJ]ジ[KMJ]マア[KMJ]パ[KMJ]ー[KMJ]ト

これで

キジアパ
マ ート

マキ
 ジ
│ア
トパ

をつくりたい

370デフォルトの名無しさん2019/05/12(日) 21:26:39.48ID:C+tli6s4
ジョインター?
ジョイナーでは?w

371デフォルトの名無しさん2019/05/12(日) 22:42:17.83ID:7HEr7+9q
ジョイナス

372デフォルトの名無しさん2019/05/13(月) 13:30:46.64ID:Dlu9US9y
女医
茄子

373デフォルトの名無しさん2019/05/13(月) 14:31:34.73ID:iR6Bb+jK
へへ
のの

へじ

374デフォルトの名無しさん2019/05/14(火) 01:37:14.88ID:M5HaQ5Df
>>369
そういうのは「文字」じゃなくてCSSとかで実装すればいいじゃん
……って思っちゃうなw

375デフォルトの名無しさん2019/05/14(火) 03:18:02.18ID:j93RjJXe
でも令和合字入れちゃったからなあ
先行規格がない生まれながらの互換文字ってかわいそうじゃない?

376デフォルトの名無しさん2019/05/14(火) 11:34:15.69ID:HHew+yI/
同じ失敗を繰り返すタイプ

数百年先を見通せない政策

377デフォルトの名無しさん2019/05/14(火) 11:58:39.59ID:ThbRtqnv
理論上は文字コードを無限に増やせる仕様じゃないとダメでしょ。

378デフォルトの名無しさん2019/05/14(火) 13:44:33.88ID:bepTC+/0
次の次で途絶えそうだし大丈夫じゃね?

379デフォルトの名無しさん2019/05/14(火) 17:50:04.82ID:kz8JbfNJ
はい、不敬罪。

380デフォルトの名無しさん2019/05/14(火) 19:19:08.26ID:ThbRtqnv
不経済

381デフォルトの名無しさん2019/05/15(水) 08:08:31.21ID:cTm8l9eF
不敬罪ではないでしょうw
実際女子しか生まれていない皇家も有るし
何らかの対策をしないと途絶える可能性は有るよ
継続させたいなら
本気で対策しないと拙いよ実際

382デフォルトの名無しさん2019/05/15(水) 08:35:40.27ID:nWHAKFhQ
>>345
今日の定例アップデートで修正入ったみたい

383デフォルトの名無しさん2019/05/15(水) 08:43:30.54ID:n5xZGXi9
だから今のうちに隠し子を作っておけと
結婚してから外で子供を作るのは嫁の人権上まずいけど
若気の至りなら仕方が無いだろう

384デフォルトの名無しさん2019/05/15(水) 08:48:22.54ID:GDL/z8kb
>>381
現実ではともかく
ネットの「不敬罪」はほぼネタだと思ったほうがいい

385デフォルトの名無しさん2019/05/15(水) 12:28:24.15ID:Pf7Y4ylf
ほとんど報道されないけどたまに逮捕されてるよな
>>378御愁傷様

386デフォルトの名無しさん2019/05/15(水) 12:44:57.00ID:n5xZGXi9
アホがいる

387デフォルトの名無しさん2019/05/15(水) 12:53:44.49ID:DmEZFbwt
地球外知的生命体との遭遇を前提に、拡張性を確保しとかないとね。

388デフォルトの名無しさん2019/05/15(水) 13:14:54.94ID:dq2v0yjU
僕の肛門も拡張されそうです!

389デフォルトの名無しさん2019/05/18(土) 16:38:38.85ID:F01l0NEI
質問
https://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/JIS0212.TXT
X0212補助漢字とUnicodeの変換テーブルは↑で良いのでしょうか?
補助漢字には詳しくなくobsolete下にあるのでこれでよいのかよくわかりません。

390デフォルトの名無しさん2019/05/20(月) 22:06:47.10ID:WPLI0l6z
Consortiumが提供しているのはそれくらいかと

391デフォルトの名無しさん2019/05/20(月) 23:48:08.42ID:8Vf/KPej
0x2237 0x007E # TILDE

これはやめた方がいいんじゃないかな…
後はまあ

392デフォルトの名無しさん2019/05/21(火) 18:21:29.99ID:wbjhm+VX
>>391
全角チルダ問題ですか?

393デフォルトの名無しさん2019/05/21(火) 18:56:30.38ID:1e7kqOhQ
チルダは主要フォントは同じ字形になっちゃったから、
ユニコードNGの環境で初めて気づくことも多いんだよね

394デフォルトの名無しさん2019/05/21(火) 20:48:03.29ID:Qf+frYPs
めんどいなあ

395デフォルトの名無しさん2019/05/30(木) 21:05:37.63ID:QqsVAtGz
Apple、算盤の絵文字がおかしいと批判される
https://idle.srad.jp/story/19/05/30/0450219/

396デフォルトの名無しさん2019/05/31(金) 06:42:14.69ID:RBuyAv83
そろばんはどうでもいいが
チーズの位置は許せない

397デフォルトの名無しさん2019/05/31(金) 17:25:05.59ID:mv11bAX3
つうか誰が何の目的で入れたんだよ
絵文字増やすことが目的になってるだろもう

398デフォルトの名無しさん2019/06/02(日) 16:33:02.27ID:DEukDi4F
だってこれまで一般人からは存在も意識されてなかった文字コードの改訂が
「今年の新絵文字発表」化してから急に世界中の注目を浴びる一大イベントになったんだもん
そら浮かれるよ

399デフォルトの名無しさん2019/06/02(日) 20:25:46.71ID:A9OZ+7QR
鼻濁音を表す仮名か゜、き゜、く゜、け゜、こ゜、カ゜、キ゜、ク゜、ケ゜、コ゜は
JIS X 0213ではそれぞれ1文字としてコードが割り当てられたのに、Unicodeでは
半濁点なしの仮名と半濁点の2文字で表さなければいけない。Unicodeにも1文字として
収録してもらいたい。

辞書に使われる記号 [名]、[形]、(単)、(複) など ([ ]は角丸正方形、( )は丸囲み文字) も
欲しい。

400デフォルトの名無しさん2019/06/02(日) 20:47:27.41ID:SX5hebJf
>>399
鼻濁音はUnicodeにちゃんと提案したら通りそう。

辞書で使われる記号は外字や私的領域に配置するしかないんじゃないかな。

401デフォルトの名無しさん2019/06/02(日) 20:57:42.19ID:gW1x1cZy
NHKの情報番組によると、最近スマホに移行した役者の役所広司さんはガラケーの絵文字が好きでスマホの絵文字が不満らしい。

402デフォルトの名無しさん2019/06/02(日) 21:05:37.93ID:A9OZ+7QR
>>400
テレビ番組表で使われる記号[字]、[ニ]、[多]、[声]、[吹]、[演]など ([ ]は正方形囲み文字) は
Enclosed Ideographic Supplement (U+1F2xx) として収録されたから、同じブロックの
空き領域に辞書用の記号も追加してもらいたい。

403デフォルトの名無しさん2019/06/02(日) 21:16:20.35ID:GqRagKZH
よくわからん
合成文字ではいけない理由って今時ある?

404デフォルトの名無しさん2019/06/02(日) 21:22:49.71ID:gW1x1cZy
池江 璃花子さんのツイート
https://twitter.com/rikakoikee/status/1135127518258667520
 ポップコーンが美味しかった。
 美味しいチャーハン食べたい。
 チーズドックもマックのポテトも食べたい…🍟
 美味しいお寿司🍣アボカド🥑
 と、からみチキン
 食べたいものと行きたいとこが多すぎる🐭🏰
https://twitter.com/5chan_nel (5ch newer account)

405デフォルトの名無しさん2019/06/03(月) 12:00:01.49ID:ZJy6OnVg
絵文字専用スレの分離独立を提案します

406デフォルトの名無しさん2019/06/03(月) 12:14:25.26ID:C5QZ8dlg
それはよくない

407デフォルトの名無しさん2019/06/03(月) 17:14:50.77ID:9GoUaP2A
さもる。とは?

408デフォルトの名無しさん2019/06/03(月) 18:10:06.92ID:waosREqi
この板に絵文字スレを別に作るのはいい案だとは思えない。一緒に扱ったほうがいい。
他の、スマホ系やネット文化系の板で絵文字スレを立てるのはそっちの文脈での必要に応じてやればいいが。

409デフォルトの名無しさん2019/06/04(火) 04:29:34.76ID:34q0LBOl
板的には絵文字禁止で

410デフォルトの名無しさん2019/06/04(火) 09:25:30.78ID:mdhyHdfA
絵文字はただのコードポイントだからなあ

411デフォルトの名無しさん2019/06/04(火) 10:53:27.04ID:uvNmGZET
このスレが絵文字の話題で埋まるのは勘弁

412デフォルトの名無しさん2019/06/04(火) 11:53:04.76ID:mdhyHdfA
これまでのところ埋まってないぞ

413デフォルトの名無しさん2019/06/04(火) 20:23:40.45ID:gwjuh1zM
>>403
それを言ったら、漢字も合字で構わなくないか? 1文字ずつコードを割り当てずに、
パーツ(部首など)に分解し、パーツと配置方法をコードで指定するIDS方式にする。
ハングルも音素に分解する。そうすれば、CJKが占めていた膨大なコード領域が
明け渡され、Unicodeを16ビットに戻せる。非CJK圏の人々はそれを望んでいそう。

漢字は情報伝達効率がとても良くて、字 2バイトで character 18バイトと同等の
情報を伝達できる。IDS上下, ウ冠, 子 の6バイトで表しても、18バイトの3分の1しか
まだない。

414デフォルトの名無しさん2019/06/04(火) 20:34:02.28ID:XXr8i2SB
shit


そうか?

415デフォルトの名無しさん2019/06/04(火) 20:35:22.41ID:XXr8i2SB
バイトでいうならそうか…
画数で無駄だなぁって思っちゃった

416デフォルトの名無しさん2019/06/04(火) 22:15:09.20ID:S8UlmLic
>>413
それを言ったら、がよくわからんが
現状で漢字は個別、>>399の仮名は合成で表現する仕組みになってるもんをそれぞれわざわざややこしくするメリットある?
あと今更ひっくり返して形だけ16bitとか言語圏関係なく望んでないと思う

417デフォルトの名無しさん2019/06/04(火) 23:31:18.83ID:sg371bFW
>>399で書かれてる辞書で使われるような丸囲みとか四角囲みはU+20DDやU+20DEと組み合わせて表せばいい。
例えば[名]はU+540D U+20DE、(単)はU+5358 U20DDで表せる。

418デフォルトの名無しさん2019/06/05(水) 21:51:36.51ID:uJguGtrO
>>413
俺もそういうのがいいとは思うけど
同じ手偏でも幅が微妙に違ったりするじゃん。
そういうのって計算というより正直 美的感覚に基づくものだから,
結局 一字一字に「手偏の幅」とかいったパラメータを与える必要が出てきそう。

419デフォルトの名無しさん2019/06/05(水) 22:43:55.33ID:U4lYdkMb
>>413
字形まで自動合成する必要はないだろ。字形は1字ずつデザインするが、それを呼び出すのに
IDSコードを使うだけ。

420デフォルトの名無しさん2019/06/06(木) 11:04:53.81ID:NifDLxm9
>>419
418だがそれはいいね。

421デフォルトの名無しさん2019/06/06(木) 13:09:21.77ID:V+RhrtBc
正直IPAmjにだけ入ってるクラスの漢字見てるとこれIDSでどうすんのって思うよ。今更どうしようもないと思う。

422蟻人間 ◆T6xkBnTXz7B0 2019/06/06(木) 13:32:02.81ID:8KYXjatA
台湾に漢字の部首を組み合わせてフォントを合成する技術があるらしい。

423デフォルトの名無しさん2019/06/06(木) 19:13:54.79ID:NifDLxm9
>>422
それってソフトウェアやライブラリとして提供されてたりする?
もしよければ教えてほしい

424蟻人間 ◆T6xkBnTXz7B0 2019/06/06(木) 19:56:27.90ID:W0KBfnTD

425デフォルトの名無しさん2019/06/06(木) 23:21:56.20ID:mU5eCwwC
技術も何もメイリオあたりもそういうのじゃなかったっけ
結局調整が必要になるっぽいけど

426デフォルトの名無しさん2019/06/07(金) 08:07:16.78ID:rFfmCjQx
なんか思ってた技術と違うわ。
IDSの組合せをそれが表現する漢字と対応させるんかと思ってた。

427デフォルトの名無しさん2019/06/07(金) 11:40:10.92ID:nJu+ZeI9
糸冬


428デフォルトの名無しさん2019/06/09(日) 18:38:42.78ID:+hAUN3Ld
漢字構成記述文字列って複数の記述文字の組み合わせとそもそもの複数の文字とをどうやって区別するんだろう。
「⿰山⿱上下」という並びが「峠」を意味するのか「山𠧗」を意味するのか区別できなくね?

429デフォルトの名無しさん2019/06/09(日) 20:33:00.79ID:SSgQq8CW
頻出度?

430デフォルトの名無しさん2019/06/09(日) 22:49:36.82ID:lml609nH
1文字になる以外の解釈が可能な定義にはなってないように見えるが

431デフォルトの名無しさん2019/06/10(月) 00:45:55.32ID:/7QyuKh+
というかもともとそういうもんじゃない?
あれは人間が読むことを前提にした文中で説明を簡素にするために使う記号であって
合成とか機械処理とかをやることははなから考えてないと思う。

432デフォルトの名無しさん2019/06/10(月) 11:07:15.11ID:g6tidy/F
⿰山⿱上下 → 山𠧗

⿰⿱山上下 → 峠

433デフォルトの名無しさん2019/06/10(月) 11:10:17.22ID:g6tidy/F
違うな
>>430 が正しい

⿰山⿱上下 → 峠 (正しい)
⿰山⿱上下 → 山𠧗 (不正)
山⿱上下 → 山𠧗 (正しい)

⿰⿱山上下 → 峠 (知らんがな)

434デフォルトの名無しさん2019/06/10(月) 11:14:02.36ID:DwfAnHcn
>>433
最後のは不正では。
⿰⿱山上下なら
↓こんな文字になっちゃう

435デフォルトの名無しさん2019/06/10(月) 13:25:56.68ID:ujTvUCPf
カッコなしで誤解釈の余地なくやるにはRPNにすればよいのでは?

436デフォルトの名無しさん2019/06/10(月) 14:05:24.64ID:DwfAnHcn
括弧なしでも漢字構成記述文字列は一意に定まるぞ。
曖昧さの余地はない筈。

437デフォルトの名無しさん2019/06/10(月) 14:06:48.56ID:DwfAnHcn
ていうかそもそも漢字構成記述文字列自体がポーランド記法っぽい性格を持ってる。
⿰⿱山上下なら⿰(⿱(山, 上), 下)みたいな関数表示になって↑>>434みたいな字形になる。

438デフォルトの名無しさん2019/06/10(月) 14:17:40.77ID:g6tidy/F
同じ文字を二通り以上の表現方法があるのはセキュリティ上やばいと爺さんが言ってた
UTF-8みたいなやつ

439デフォルトの名無しさん2019/06/10(月) 14:19:52.70ID:g6tidy/F
例えば

⿰男⿰女男

⿰⿰男女男

440デフォルトの名無しさん2019/06/10(月) 14:43:12.52ID:VjrzvIQA
男女 男

右端は俺orz

441デフォルトの名無しさん2019/06/10(月) 14:45:35.90ID:AYc4wpPC
全然関係ないが男女男男女女男女男女を思い出した。おっさんだな、俺。

442デフォルトの名無しさん2019/06/10(月) 14:55:32.08ID:DwfAnHcn
>>439
嬲は「⿲男女男」じゃないの?

443デフォルトの名無しさん2019/06/10(月) 14:56:33.42ID:g6tidy/F
だから複数あるっていう意味で書いたんだが

正規化で一つにっていうのは判る

444デフォルトの名無しさん2019/06/10(月) 20:42:06.03ID:QC59E/Dz
表現意図としては比が2:1:1と1:1:2と1:1:1で違いがあるような

445デフォルトの名無しさん2019/06/10(月) 23:11:41.70ID:rO86gbFX
>>399-400
鼻濁音付き仮名文字は日本NBから提案したけど蹴られて今の姿になった。
http://std.dkuug.dk/JTC1/SC2/WG2/docs/n2092.pdf

仮名文字に限らずシーケンスで表現可能な文字に単体の文字コードを割り振ってもらうのは
相当説得力のある理由が要る。

逆に辞書用の記号は提案書を出せば通る可能性ありそう。

446デフォルトの名無しさん2019/06/11(火) 01:59:35.04ID:SK3ydrDR
ぽげむたは?

447デフォルトの名無しさん2019/06/11(火) 04:13:44.44ID:Yb3f0IhW
>>443
いや、>>444も言っている通り嬲は「⿲男女男」以外で表わせないと思うよ。

448デフォルトの名無しさん2019/06/11(火) 08:44:46.66ID:GW+sQhXS
将棋好きのおいらとしては、ひっくり返った「玉」「飛」「歩」とかも
登録してほしいと思うのだが。

449デフォルトの名無しさん2019/06/11(火) 10:41:29.12ID:Yb3f0IhW
>>448
Unicodeってそもそも将棋の駒 全部登録されてないんじゃ?

450デフォルトの名無しさん2019/06/11(火) 11:48:29.98ID:9Qw6sZwd
笑→ケケ夭
とか
禁→木木示
とか
哭→口口犬
とか

畿→糸糸田戈
は同じ表現?

451デフォルトの名無しさん2019/06/11(火) 12:18:11.06ID:Yb3f0IhW
>>450
まあ機械処理向けの言語じゃないから
人が「分解できる」と思うかどうかだよね
ちなみに「畿」の部首って「田」なんだな。すげー意外。

452デフォルトの名無しさん2019/06/11(火) 12:35:42.68ID:GW+sQhXS
>>449

ないよ。黒塗り五角形と白ヌキ五角形だけ。

453デフォルトの名無しさん2019/06/11(火) 14:57:42.64ID:Y18rXsQw
文字表現ってことで
●●構えっていうと門しか思い出せないし
●●囲いっていうと口しか思い出せないけど
将棋の駒の白抜き五角形は囲いなんだろうか

454デフォルトの名無しさん2019/06/11(火) 17:55:27.24ID:Yb3f0IhW
いっそのことCombining Diacritical Marks for Symbolsあたりに将棋の駒の枠線を登録してもらえればいい

455デフォルトの名無しさん2019/06/12(水) 00:03:22.24ID:82Q6hISi
>>424
そこ日本の会社

456デフォルトの名無しさん2019/06/12(水) 01:16:49.13ID:ynCJAfYS
>>454
枠線の中に複数文字入れるのどうするとか
中に「と」みたいなのを表示したい場合それは本当に「と」で表現するのかとかいろいろややこしくなりそう
将棋みたいに中身が決まってるやつは一通り個別に並べてもらったほうがシンプルじゃないのかな…

457デフォルトの名無しさん2019/06/12(水) 01:57:37.00ID:qj/fM2VI
https://www.unicode.org/L2/L2018/18170-shogi.pdf

逆さのまではなくてもいいと思うがなあ

458デフォルトの名無しさん2019/06/12(水) 07:01:32.61ID:XwhNnAHz
あ、すでに議論の対象にはなってるのか。

459デフォルトの名無しさん2019/06/12(水) 08:39:27.70ID:QJXYMRLU
>>453
黒と白で、先手と後手を表しているだけだよ。

460デフォルトの名無しさん2019/06/12(水) 09:02:03.43ID:om/mzkP2
文章中に書くなら白黒五角形で十分だと思うが、なんで盤面まで表現したがるかな。

461デフォルトの名無しさん2019/06/12(水) 11:21:19.79ID:tqvE0DW+
歩の裏の「と」があるべき位置に
「テ」だったか「〒EL」みたいな
意味不明な文字が書いてある駒セットを
観たことがあるけど
あれはなんだったんだろう
朝鮮語か?

462デフォルトの名無しさん2019/06/12(水) 12:54:03.65ID:QJXYMRLU

三 みたいなやつ?

全ての「成金」の文字は「金」を崩した文字だよ。
「と金」も、本当は「と」と書いてあるわけではなく、
「金」を崩した結果、「と」みたいになっているだけだよ。

463デフォルトの名無しさん2019/06/12(水) 13:18:58.92ID:tqvE0DW+
Tも三も金なんですね

464デフォルトの名無しさん2019/06/12(水) 17:24:29.90ID:XwhNnAHz
どうでもいいけどそのレスを見て
その内 崩し字も登録されそう…とか思ったw
太字のaとかがなぜか「文字」として登録されてるんだから金の崩し字が登録されてもおかしくない

465デフォルトの名無しさん2019/06/12(水) 17:54:37.18ID:o59LDmQW
歩兵の裏は金と同じ読みの今(きん)の崩し字をあてたので
「と」と極めて似た文字になったという説がある

466デフォルトの名無しさん2019/06/12(水) 23:56:15.89ID:4S3+zhe0
T



なんでこれで金になるのかさっぱり判らん
文字コード総合スレ Part12 	->画像>17枚

あと
|
とか

とか
謎のが多すぎ

467デフォルトの名無しさん2019/06/13(木) 01:03:53.78ID:WD6Kvaf7
崩し字はむずかしうてわからん

468デフォルトの名無しさん2019/06/13(木) 01:05:01.31ID:WD6Kvaf7
崩し字というかバラし字?

469デフォルトの名無しさん2019/06/13(木) 01:11:22.08ID:uH0MzXQS
>>457
どうなったか調べてみた。L2/18-170は2018年8月開催のUTC #156で議論され、
議事録には提案者にfeedbackを返したとだけ記録されている。
http://www.unicode.org/L2/L2018/18183.htm のe.5

で、この文書番号で検索すると同じ提案者の出したL2/18-342が引っかかって
そこにこう書いてある。
> Shogi proposal. The proposal I am talking about is (L2/18-170), the committee's
> rationale for rejection was that: “the symbols in question were not attested in
> lines of text”.

インラインテキスト中で使われている用例が示されていないのでrejectされたらしい。

470デフォルトの名無しさん2019/06/13(木) 01:32:11.84ID:domb7+if
なるほどなあ。
チェストーはインラインで使ったりするもんなんだろうか

471デフォルトの名無しさん2019/06/13(木) 06:29:39.15ID:IV8IxRGq
日本NBが後押しすれば10646に入りそうな気がするけどね
漢字以外は興味持たないだろうって見透かされてるんだろうな

472デフォルトの名無しさん2019/06/14(金) 11:32:49.03ID:BMAIfRwQ
まあ言いたかないけど 欧米が制定した企画だからね……。
あきらかに文化的な偏りはあると思う。
この間もモンゴル文字かなんかを文字の結合方式とかをほとんど考慮しないで登録してしまった
という旨でUnicode共同体を批判してるブログ見掛けたし。

473デフォルトの名無しさん2019/06/14(金) 12:45:36.88ID:AVMOMmmV
https://nixeneko.hatenablog.com/entry/2018/03/04/140000
モンゴル文字のことはよくわからんが、ここに書いてあることによると、

> モンゴル文字は、語の中のどの位置にくるかによって、また母音調和等によって形が変化する。

> 中国・モンゴル国の両国ともに現状と地続きの音声アプローチの方を支持しているようであるが、
> 最終的にどの方式が選ばれるにしろ、相互運用性が確保されることは期待できそうである。

ということだから、現状の規格は、中国・モンゴル国が希望したものであって
欧米人が悪いというわけではないと思う。

474デフォルトの名無しさん2019/06/14(金) 12:54:39.24ID:AVMOMmmV
ただ、似たようなものは英文にもあるわけで、fish や office のように、
f,i,j,l が続く場合は、文字を合字(リガチャ)にする場合が多い。

しかし、MSword も TeX も、「合字にせよ」という指定を入れなくても、
勝手に合字にしてくれるわけで、モンゴル文字も(よく解らんけど)
同じようにできないのかな、とは思う。

475デフォルトの名無しさん2019/06/14(金) 13:00:53.97ID:AVMOMmmV
ごめん。誤り。MSwordは指定しない限り、合字にはならなかった。

476デフォルトの名無しさん2019/06/14(金) 21:13:23.45ID:bakZpKUF
ガチャーン合体!

477デフォルトの名無しさん2019/06/15(土) 12:06:26.17ID:s4HbSmAb
>>466
筆で金とうい字を1000回くらい書くとわかるようになるよ。ようは手抜き。

478デフォルトの名無しさん2019/06/15(土) 21:00:26.68ID:dgVxOSWc
わけわからんまで崩していくのは日本独特?

479デフォルトの名無しさん2019/06/16(日) 11:45:02.01ID:NdAq/MEw
これもなんで金になるのか判らんやつ

でいいのに
https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRN0np1ZmeG8ZgXTV8K1Vjx-yF9KCNZgu3AKkiOYyYxdnnl-wk7

480デフォルトの名無しさん2019/06/16(日) 13:03:35.22ID:8f8EXiHl
木天火土水で6人目のゴールドは光です・・・

481デフォルトの名無しさん2019/06/16(日) 17:16:00.47ID:UaT4ATnR
>>479-480
わらったw

482デフォルトの名無しさん2019/06/18(火) 06:18:41.06ID:3nOE2mBA
プログラム板にキチガイ降臨中!botに一晩も反応する異常さ
一般人(学校恩師)に殺害予告をしているのでスレ建て通報してください。
http://2chb.net/r/tech/1559872586/

142 名前:a4 ◆700L1Efzuv 投稿日:2019/06/18(火) 05:29:55 ID://qVkzO
>>141
名古屋の人な 俺ね、君の問題を大橋先生と混ぜないことにする。つまりね、
片桐孝洋のことをボコろうと思う。普通に顎の骨を折る。これくらいで警察来るか?
一般市民とかさ、普通にさ、俺らの秘密なんだけどさ、日本人なんて復活ねーから。

483デフォルトの名無しさん2019/06/22(土) 01:57:21.14ID:t+lz7b+S
>>482
釣られて そのスレ見に行ったけど
寧ろそのa4っていう小手の人が被害に遭ってるように思えたけどな

484デフォルトの名無しさん2019/06/25(火) 03:50:40.53ID:wcrPNuwW
ヲシテ文字って使えないの?

485デフォルトの名無しさん2019/06/25(火) 05:40:01.35ID:DXMPLOPq
Unicode協会が配布してるプログラムでシェルスクリプトでUTF-8文字列を扱えるデータってないかな。
入力されたUTF-8文字列が何文字かを判定したりするのに都合の良いスクリプト。

486デフォルトの名無しさん2019/06/25(火) 06:09:39.19ID:1JIWmrxD
にほんごでおk

487デフォルトの名無しさん2019/06/25(火) 06:42:32.78ID:DXMPLOPq
CLDR for shellみたいなのがないかなと。

488デフォルトの名無しさん2019/06/25(火) 13:49:53.45ID:takEpFxW
Unicode協会って書かれると、アグネスがやってるパチモンに見えてくる

489デフォルトの名無しさん2019/06/28(金) 22:59:11.92ID:NkHCwivq
使えないよ
その手の文字が登録されたことはあるのかな

490デフォルトの名無しさん2019/06/29(土) 01:02:31.02ID:P81PdZpf
Dohentaiyagana

491デフォルトの名無しさん2019/06/29(土) 01:49:55.29ID:LWdOpl9S
神代VSでまとめてしまおう

492デフォルトの名無しさん2019/06/29(土) 02:20:12.41ID:g9Pe6ky6
最近Kenのツイートが酷い
LunaticとかAdobe的にいいのか

493デフォルトの名無しさん2019/06/30(日) 02:04:42.75ID:1ALBmyOB
絵文字をリガチャとして実装するという話を聞いたことがあるが
良いアイデアだと思う。
これ以上貴重な符号位置を占有しないで欲しい。

494デフォルトの名無しさん2019/06/30(日) 02:44:42.35ID:KxegnpZe
絵文字ガチャに見えた

495デフォルトの名無しさん2019/06/30(日) 18:46:20.88ID:1ALBmyOB
https://symbolset.com/
これとか。素晴しい発想だと思いませんこと?(お嬢様風)

496デフォルトの名無しさん2019/06/30(日) 19:55:14.68ID:VWoLS78P
全然

497デフォルトの名無しさん2019/06/30(日) 20:32:53.74ID:MkBgWLvD
見る側の環境によって、絵文字を使った側の人が意図しなかった単語に化ける現象が発生してしまう

498デフォルトの名無しさん2019/06/30(日) 21:02:05.57ID:1ALBmyOB
>>497
実はそれを意図しているんだな、これが。
Webフォントが使えなかった場合に,意味不明な私的領域のコードポイントではなくその絵文字の「意味」の単語になるっていうフェールセーフ。
この発想はアクセシビリティの面からしてすごいと思う。
今までも↑こういうことを実現する手段はあったが(aria-*とか::beforeとかを活用する),
いささかハックじみた手法だったのに対して,この方法はほとんど何のひねりもないし,かつ
高いアクセシビリティを誇る。

499デフォルトの名無しさん2019/06/30(日) 21:31:19.26ID:2juPiYlp
なんか公式ページの説明が簡素すぎてよく分からん。
素晴らしさを伝える記事とかないの?

500デフォルトの名無しさん2019/06/30(日) 22:16:35.89ID:MkBgWLvD
>>498
全然意図してないと思うぞ。>使った側の人が意図しなかった単語に化ける現象
これがアクセシビリティ向上になるのは入力者が単語と絵文字の対応を把握している場合だけで、
把握してない場合は入力者が知らない結果が出力される謎フォールバックになる。

入力者が絵文字パレットから選ぶ仕組みなら単語を把握してない可能性が高まるし、
個別に校正かけるなら元々あるimg altとかではなくWebフォントを使う強みは何?ってなるし

501デフォルトの名無しさん2019/06/30(日) 23:23:56.67ID:sPnkqdOZ
どのフォントでどこからどこまでリガチャっていう指定を含めないといけないからプレーンテキストで利用できない
リッチテキスト使えるなら画像でいい

502デフォルトの名無しさん2019/07/01(月) 00:12:01.52ID:vOsPyG+v
This is a pen��.とか[�� Download Now!]みたいにもともと並べて使うことも多いしな。
This is a penpen.や[Download Download Now!]は変やろ。あとThat is a ��guin.の誤爆避けも必要になる。

503デフォルトの名無しさん2019/07/01(月) 05:12:02.84ID:2smzn43h

504デフォルトの名無しさん2019/07/01(月) 05:12:32.89ID:2smzn43h
>>500
Webフォントを使う強みはページ読み込み速度の向上だと思うよ。

505デフォルトの名無しさん2019/07/01(月) 05:13:03.16ID:2smzn43h
>>500
あ、それと色とか大きさとかをCSSでより柔軟に調整できる。

506デフォルトの名無しさん2019/07/01(月) 12:02:58.02ID:liKrIWIO
SVGベタ書きがいいと思う

507デフォルトの名無しさん2019/07/01(月) 13:38:09.58ID:Ltl936Sg
WebフォントってDL待ちでむしろ遅いイメージしかないな…

508デフォルトの名無しさん2019/07/01(月) 16:21:02.28ID:MoEwNeEz
日本語だとどうしても…
サブセット化もこれから足してくコンテンツ考えるとあんまりいいソリューションとは…

509デフォルトの名無しさん2019/07/01(月) 19:16:16.83ID:2smzn43h
>>507
>>508
絵文字リガチャフォントだと高々100個くらいだから
日本語Webフォントの常識は当て嵌らんぞ

510デフォルトの名無しさん2019/07/01(月) 21:01:31.88ID:1h0unusf
推すなあ。
あえてこれ使いたいと思うならもちろん自由に使えばいいと思うが、
正直これを選ぶメリットがある局面はすごく限られてる気しかしない。

511デフォルトの名無しさん2019/07/04(木) 14:48:01.78ID:nXaEmuLe
ISO/IEC 10646:2017/Amd 2:2019 - Nandinagari, Georgian extension, and other characters
https://www.iso.org/standard/73773.html

いつの間にか完成していた。

512デフォルトの名無しさん2019/07/05(金) 07:31:35.09ID:CMdnJVDV
JISにも取り込まれるかな?

513デフォルトの名無しさん2019/07/12(金) 14:32:58.64ID:q8HbeEfz
>>97
BCってなに?

514デフォルトの名無しさん2019/07/12(金) 23:51:11.25ID:aHiS7zOG
ブラックキャップ

515デフォルトの名無しさん2019/07/13(土) 19:08:40.33ID:Wy302ne8
まじめに答えてほしかった。。。

516デフォルトの名無しさん2019/07/13(土) 20:43:48.97ID:tESkaNg7
����?

517デフォルトの名無しさん2019/07/13(土) 22:47:35.97ID:0DH1k/wL
>>516
何これ?

518デフォルトの名無しさん2019/07/14(日) 01:25:41.28ID:cxt0+A+5
ブラックキャップ

519デフォルトの名無しさん2019/07/14(日) 09:54:29.74ID:N6Jg+9Qo
ワロタ

520デフォルトの名無しさん2019/07/14(日) 22:04:02.29ID:GSQZGuhE
>>513
>>97じゃないから確かなことは言えないけど
「better choice」じゃないかな?
つまり絵文字を「入れざるを得ない」ってことね。

521デフォルトの名無しさん2019/07/15(月) 03:44:17.27ID:GN7I2Kmp
単に後方互換だろ…

522デフォルトの名無しさん2019/07/15(月) 04:14:22.81ID:GXO+LVjR
BA-90使いたいのに斑の黄顔になるのはなんだかなー

523デフォルトの名無しさん2019/07/16(火) 23:08:05.64ID:6ZdisLnD
IC: 相互互換性
FC: 前方互換性
BC: 後方互換性
UC: 上位互換性
LC: 下位互換性
ちい覚えた

524デフォルトの名無しさん2019/07/17(水) 11:56:39.82ID:FD/sfaX1
LeftとかRightとかCorrectは無いんか

525デフォルトの名無しさん2019/07/17(水) 16:54:36.95ID:Lq1+nMLH
>>524
correctはともかく左右は確実にねーだろw

526デフォルトの名無しさん2019/07/18(木) 14:33:21.11ID:44Ax18Yo
共産とりっけんと社民社と国民主と令和革命はLC互換

527デフォルトの名無しさん2019/07/18(木) 23:12:28.17ID:BkvY1rKv
>>526
わろたw

528デフォルトの名無しさん2019/07/23(火) 15:56:55.39ID:vatz3/hX
https://github.com/qntm/base65536
↑Unicodeの基本多言語面を使ったエンコード方法w

529デフォルトの名無しさん2019/07/23(火) 17:04:19.76ID:yKl7I/yp
高度に発達したエンコードはMojibakeと見分けがつかない

530デフォルトの名無しさん2019/07/24(水) 00:37:51.21ID:ArGZw8p9
基本多言語面って制御文字含んでるよね。
それbaseXXの本来の意味を成してないw

531デフォルトの名無しさん2019/08/18(日) 16:07:01.10ID:zqR8kD3Y
W3Cのwebページが文字化けしてて草。
文字コードの本元の一つがこんな体たらくでいいのだろうか…w
https://www.w3.org/People/mimasa/xmldev.html.ja.sjis

532デフォルトの名無しさん2019/08/18(日) 17:27:15.46ID:wpOWgZAQ
読めるけど...?

533デフォルトの名無しさん2019/08/18(日) 23:04:31.46ID:8LEpKI7v
ISO-2022-JP のくせに content-type: text/html; charset=shift_jis で送ってきてるからなあ

534デフォルトの名無しさん2019/08/19(月) 01:20:35.42ID:JKQq3Dbg
(´・・∀・・`)ほう

535デフォルトの名無しさん2019/08/19(月) 06:07:28.33ID:xlQPwL5+
>>533
あ、そういうことか。と思ったけどChromiumだとどうしようもねぇわ。
最近のブラウザって文字コードを修正する機能みたいなのって消えてるね。

536デフォルトの名無しさん2019/08/19(月) 07:31:42.15ID:SJok1opV
>>535
Firefox68には文字コード指定が残ってる
通常は無効になってるけど>>531のリンク先を表示したときは有効になって
ISO-2022-JPを指定すると文字化けなしで読めた

537デフォルトの名無しさん2019/08/19(月) 08:38:57.28ID:xlQPwL5+
ところでW3Cって文字コードの制定とかに関わってたっけ?
XMLが使う符号化文字集合にUnicodeを推奨してるくらいじゃない?

538デフォルトの名無しさん2019/08/20(火) 11:37:07.61ID:zlJnj2O9
>>531
これはひどいω

539デフォルトの名無しさん2019/08/20(火) 11:39:07.12ID:zlJnj2O9
>>533
ファイル名まで .sjis つけてるくせになんで iso-2022-jp で保存してるのかイミフ

540デフォルトの名無しさん2019/08/20(火) 18:30:12.77ID:Gkd3xMH4
なんか同じような原因で文字化けしてるページに対して
同じようなレスをした記憶が…と思ったら前スレにあった。
記憶障害じゃなくてよかったw
http://2chb.net/r/tech/1516629503/821-843

541デフォルトの名無しさん2019/08/20(火) 21:44:07.86ID:Y189B2BT
HTMLをiso-2022-jpにするのって
どこの文化なんだろうか?

Windowsはsjisだからありえないし
Linuxも昔の普通はEUC-JPだろ?

iso-2022-jpはメールにしか使われてなかったはずだが

542デフォルトの名無しさん2019/08/20(火) 21:47:57.43ID:UVunetX1
>>531
イシカワ マサヤスというのは誰だろうね。

543デフォルトの名無しさん2019/08/20(火) 21:51:25.41ID:Y189B2BT
イシカワ マサヤスさんでは?

544デフォルトの名無しさん2019/08/20(火) 21:52:36.86ID:UVunetX1
石川雅康と石川哲志は親族だろうか?

どちらもICT業界から去ったのかな。

545デフォルトの名無しさん2019/08/20(火) 21:54:13.55ID:Y189B2BT
またつまらんものを

546デフォルトの名無しさん2019/08/20(火) 21:58:33.22ID:UVunetX1
XHTMLが終わってしまって、そのまま放置の石川さん。

547デフォルトの名無しさん2019/08/20(火) 22:46:49.05ID:anpoimU7
>>541
sjisやeuc-jpが整う前は、HTMLをiso-2022-jpにするのも選択肢の一つだったらしい
http://www.tohoho-web.com/lng/199801/98011002.htm

548デフォルトの名無しさん2019/08/20(火) 23:01:02.75ID:UVunetX1
>>547
http://の先頭のhを取っても付けても同じですよ。

549デフォルトの名無しさん2019/08/20(火) 23:43:43.88ID:Gkd3xMH4
> どこかの雑誌で、「charset=iso-2022-jp は自動判別の指定」と堂々と紹介された
http://web.archive.org/web/19980116120529/http://www.pro.or.jp/~fuji/horrible/horrible.kanji.html
えぇ……。

550デフォルトの名無しさん2019/08/21(水) 00:08:09.19ID:/FRdjxvW
1998年当時のWebブラウザはキャラクタセットの判定すら怪しかった。

551デフォルトの名無しさん2019/08/21(水) 02:35:13.27ID:GZen3C6t
>>549
そのリンク先に書いてあるけど、iso-2022-jp が使われてるのはMSが発端なのか?

> name="GENERATOR" content="Microsoft FrontPage 2.0"
> というのが各HTMLファイルの先頭にあることから、Microsoft の FrontPage が 漢字コードがシフトJISのファイルであるにもか かわらず、iso-2022-jp の指定するからではないかと思われます。

552デフォルトの名無しさん2019/08/21(水) 03:44:23.93ID:jDiMObB6
>>540
流れは似てるが今回は指摘されてるURLが問題なんだろ
よりによってアイツがってやつさ

5535512019/08/21(水) 05:07:33.18ID:GZen3C6t
あ、違ったわ。MSのはMicrosoft FrontPage 2.0がmetaタグの指定を間違ってるって話で
HTMLの内容がiso-2022-jpというのはまた別問題か

sjis以外あるかな?ってやってみたら他のエンコーディングも見つかったし
>>531は単なる文字コード変換ミスかな?

https://www.w3.org/People/mimasa/xmldev.html.ja.aaaaa

554デフォルトの名無しさん2019/08/21(水) 14:49:37.63ID:ur92HW83
拡張子付け間違いか

555デフォルトの名無しさん2019/08/22(木) 06:16:14.71ID:mlpPC2JR
ブラウザって一時だけでも拡張子によって文字コードを判断してた時期があったの?
俺の記憶にはないのだけども……。

556デフォルトの名無しさん2019/08/22(木) 06:36:57.94ID:jM8tCXZ0
だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jisなのに
中身がiso-2022-jpなんだってば

iso-2022-jpが使えるテキストエディタで書いたか
sjisに変換すべきところをiso-2022-jpに変換してしまったということ
昔のWindowsで書いたならsjisになるだろうから変換ミスかなって話

557デフォルトの名無しさん2019/08/22(木) 08:04:31.58ID:jlFkmCtz
jisって拡張子ならiso-2022-jp(JISコード)なのは意図通りだろ
HTTPヘッダのcharsetが食い違ってるだけで

558デフォルトの名無しさん2019/08/22(木) 09:50:35.92ID:xQsiKIbM
鯖の仕様が変わってcharsetのデフォが変わったからな
サーバー引越のときに設定間違えた可能性はあり得る

559デフォルトの名無しさん2019/08/22(木) 10:23:09.36ID:jM8tCXZ0
>>557
拡張子はjisじゃなくてsjisな
だからドキュメントの文字コードが明らかに間違ってるんだよ

560デフォルトの名無しさん2019/08/22(木) 10:30:34.86ID:jM8tCXZ0
昔のブラウザはHTTPヘッダのcharsetよりも
ドキュメントからの文字コード判定の方を重視していた。

なぜならセキュリティというかサーバー運営者がよくわかっておらず
設定変更の必要性を理解できていなかったので設定されてなかった
たとえ設定変更ができるサーバーでもユーザーが理解していなかった

そんな時代だからブラウザで表示できれば良し程度のレベルが普通で
今からするとチェックが甘かった。その当時の間違った文字コードのページが今も残っている。

たぶんこんなところ

561デフォルトの名無しさん2019/08/22(木) 10:33:49.69ID:8JJS2LZD
>>559
お前のレスの >>556 には jis って書いてあるだろω
お前が原因

562デフォルトの名無しさん2019/08/22(木) 10:35:00.76ID:jM8tCXZ0
>>561
単なる書き間違えじゃね?
リンク先見ればわかるでしょ

563デフォルトの名無しさん2019/08/22(木) 10:38:26.99ID:8JJS2LZD
>だからこれはjisという拡張子でHTTPヘッダのcharsetもshift_jis

こういうおっちょこちょいが >>531 みたいなミス連発するんだろうな

564デフォルトの名無しさん2019/08/22(木) 15:58:03.72ID:mlpPC2JR
皆さん落ち着いて

565デフォルトの名無しさん2019/08/23(金) 17:29:19.40ID:bWgnQwQ7
なんでUTF8以外違法になった今そんな話してんだか・・・

566デフォルトの名無しさん2019/08/23(金) 17:59:07.09ID:UifFOlyJ
× 違法 ○ 非推奨

567デフォルトの名無しさん2019/08/24(土) 00:05:20.43ID:Ka96Zrl8
秘宝とか緋水晶とか何の話をしてるんだ?

568デフォルトの名無しさん2019/08/25(日) 20:34:39.12ID:++G8a3I1
ムーンプリズムパワー!メイクアップ!

569デフォルトの名無しさん2019/08/25(日) 22:05:01.03ID:E2o3oeEK
タリスマン

570デフォルトの名無しさん2019/08/25(日) 22:36:09.44ID:heTmUHGD
クリマタスミ

571デフォルトの名無しさん2019/08/28(水) 13:35:52.48ID:AiVdwxrR
ひまだ

572デフォルトの名無しさん2019/08/28(水) 19:19:16.62ID:lfvHhqTB
サクラエディタがとうの昔にUTF32対応していた事実をいまごろ知った。

573デフォルトの名無しさん2019/08/28(水) 20:04:07.93ID:FG4A80Dg
じっさい32じたいそんな使わないだろw

574デフォルトの名無しさん2019/08/29(木) 18:28:30.40ID:VG5IecJ5
でもUTF-16の「どんな文字でも固定ビット幅」という利点が失われてしまった今,
固定ビット幅が実現できる唯一の規格であるUTF-32は希少では。

575デフォルトの名無しさん2019/08/29(木) 18:42:08.11ID:y3rrvHgi
読むぶんにはナイーブな実装で足りるからいいけど実際使うとなったら00が無駄に思えてきて敬遠しがち
だからもしかすると文字コードでさえ適材適所なのかと考え始めている

576デフォルトの名無しさん2019/08/29(木) 18:49:00.69ID:1ks18uap
内部表現は32bit単位で固定長の方が楽
ファイル読み書きのときはutf-8で勝利
あとはcps932が滅ぶのを待つだけ

577デフォルトの名無しさん2019/08/29(木) 19:05:33.35ID:VG5IecJ5
OSのインターフェースはUTF-8,内部表現はUTF-32が一番いいのかもね。
UTF-32だとASCIIに比べて単純計算で四倍弱の容量を食ってしまうのが難点。
でもOSの本体くらいならそもそもテキストとして表現されてるファイルも少ないし案外肥大化は防げるのかも。

578デフォルトの名無しさん2019/08/29(木) 19:09:37.98ID:CAV+1+Xc
という会話を何年も前にこのスレで観た

579デフォルトの名無しさん2019/08/29(木) 19:11:19.48ID:YrWceYNE
複数のコードポイントのシーケンスで一文字を表現するUNICODEだから
UTF-32でも一文字が32bitで収まるとは限らないからUTF-8でも大差ない

580デフォルトの名無しさん2019/08/29(木) 20:02:33.30ID:jljmwQsV
プログラミング言語C++に関していうと、x64版Linux用gccは既定でwchar_tのサイズが4バイト。
つまりx64版Linux用gccはstd::wstringがUTF-32。誰も使っていないように見えてそうでもない。

581デフォルトの名無しさん2019/08/29(木) 21:00:32.68ID:FJllEP/G
【名案】0〜9の代わりにUnicode全文字を使えば「65536進法」になり,なんでも1桁で表現できるから2桁の計算が不要! ・・・ためしに「65021−65018=3」ってどう書くの?
https://togetter.com/li/1396827

582デフォルトの名無しさん2019/08/29(木) 22:50:02.31ID:azXlKn0W
UTF-16でも8バイト必要なのに、32bit(4バイト)に収まるわけ無いだろうw

漢字1文字が最大8バイト、Unicodeの「IVS」とは?
https://tech.nikkeibp.co.jp/it/article/COLUMN/20100126/343783/

583デフォルトの名無しさん2019/08/29(木) 23:01:38.50ID:jljmwQsV
UTF-8だけで必要十分という結論に到達せざるをえない現実

584デフォルトの名無しさん2019/08/29(木) 23:09:19.19ID:azXlKn0W
逆なんだよな。
本来UTF-32だけで必要十分だったのにどんどん複雑にしていって、
UTF-32でも不便になったからUTF-8でいいでしょ?
どうせ単純には扱えずライブラリ使うしか無いんだから。
という必要十分な文字コードを捨てたというのが現実

585デフォルトの名無しさん2019/08/29(木) 23:11:55.32ID:jljmwQsV
宇宙に存在するすべての知的生命体が用いている文字すべてを網羅するのがUnicodeの理念。
たったの32bitで足りるわけがない。

586デフォルトの名無しさん2019/08/30(金) 00:11:25.73ID:h/StilS8
文字コードのスレッドなのにUnicodeがわかっていないやつらばかりw

587デフォルトの名無しさん2019/08/30(金) 01:01:22.62ID:LpXSw35l
UTF-32じゃなくてUCS4じゃないの?内部コードに便利なのは

588デフォルトの名無しさん2019/08/30(金) 01:29:38.44ID:/ghu33Nb
>>586
ではどうぞ御説明をどうぞw

589デフォルトの名無しさん2019/08/30(金) 13:00:23.27ID:oVszNH41
>>579
codecvtは糞だ

590デフォルトの名無しさん2019/08/30(金) 13:03:12.55ID:oVszNH41
>>580
だった
まあどっちでもいいけど

591デフォルトの名無しさん2019/08/30(金) 15:32:59.58ID:6uSriybI
>>588
UTF-16を16ビットで1文字を表すと思い込んでいる人間がいるが、16ビット単位でデータ扱うだけで、1文字が32ビットのこともある。

592デフォルトの名無しさん2019/08/30(金) 15:56:24.57ID:iPGqG8dk
>>591
それぐらいみんな知ってる

593デフォルトの名無しさん2019/08/30(金) 17:05:21.42ID:GEn/r+mZ
>>592
それぐらいみんな知ってる

594デフォルトの名無しさん2019/08/30(金) 17:19:36.31ID:57FOZgRt
ビットサイズ固定でどうにかなると思っていた時期が俺にもありました。

595デフォルトの名無しさん2019/08/30(金) 17:27:36.02ID:GEn/r+mZ

596デフォルトの名無しさん2019/08/31(土) 10:08:53.77ID:0iGUnrw4
>>591
スレの流れみた?UTF-32の話をしてんだぞ?

597デフォルトの名無しさん2019/08/31(土) 15:33:43.16ID:SHne0DDt
>>596
そのまえ

598デフォルトの名無しさん2019/08/31(土) 15:35:30.15ID:SHne0DDt
6 仕様書無しさん sage 2019/08/31(土) 11:36:13.12
日本人ならUTF16を掲げるJavaを支持すべきだ

599デフォルトの名無しさん2019/08/31(土) 15:37:04.56ID:3i1dPJsj
>>598
それは理由が書いてないから、読む価値ある?

600デフォルトの名無しさん2019/08/31(土) 15:45:23.47ID:4qIvp+ND
なんで毛唐の決めたコードを支持するのか、意味が分からん
ネットウヨの類は米英には尻の穴まで晒すようだし困ったものだ

601デフォルトの名無しさん2019/08/31(土) 15:56:52.05ID:3i1dPJsj
ん?支持しなくて良いよ

602デフォルトの名無しさん2019/08/31(土) 17:12:51.44ID:0iGUnrw4
>>597
じゃあ >>586 はスレの流れを遮って,古い話題を煽り文句で蒸し返した挙句,
碌な知識も持ってないことを晒してしまったヤベー奴ってことになるけどいいの?

603デフォルトの名無しさん2019/08/31(土) 17:59:12.56ID:Yn5v13ie
ネットウヨw

604デフォルトの名無しさん2019/08/31(土) 20:21:37.85ID:5EL66xzp
re2のようにUTF-8にしか正式対応していない正規表現ライブラリもある。

605デフォルトの名無しさん2019/08/31(土) 22:52:53.39ID:0iGUnrw4
寧ろre2がUTF-32に対応すべきでは。
もしくはiconv使う。

606デフォルトの名無しさん2019/08/31(土) 22:58:57.55ID:3i1dPJsj
UTF-32対応は難しいから無理だろ

607デフォルトの名無しさん2019/09/01(日) 01:36:48.58ID:sYwYgS29
iconv禁止

608デフォルトの名無しさん2019/09/01(日) 09:07:17.74ID:XF6G4Ohn
NKF(Network Kanji code conversion Filter)を使えば?

Ruby にも、NKF モジュールがある

609デフォルトの名無しさん2019/09/01(日) 10:46:26.40ID:YneNC5Ev
別にコード変換ツールを探してるわけじゃなくね?w

610デフォルトの名無しさん2019/09/01(日) 10:52:49.46ID:kCJZVLuH
どこぞの皇帝や中国王朝みたいに文字の方を変えて宇宙統一してしまえば良い
文字コードに合った文字だけ使えば解決

611デフォルトの名無しさん2019/09/01(日) 12:53:54.91ID:k0czTyLP
収録文字数が2の16乗を超えた時点でUTF16は破綻したんだから、サロゲートペアなんて
煩雑な延命策を取らず、UTF32に完全移行すべきだった。

UTF16を残したせいでUTF32にも皺寄せが来ている。UTF32ではU+FFFFFFFFまで
対応できるはずなのに、UTF16のサロゲートペアで表せるU+10FFFFまでに符号空間が
制約されてしまった。つまり、実質的に32ビットではなく21ビットコードになってしまった。

UTF16を全廃しUTF32を本来の32ビットまで拡張すれば、異字体を異字体セレクタなしで
収録できるから、すべての文字を32ビットで表せて単純明快になる。

612デフォルトの名無しさん2019/09/01(日) 13:07:58.05ID:lmQdJ5gb
>>611
いろいろ間違ってるなw

まずUTF-16という仕様にはサロゲートペアが最初から含まれてる
UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
既に使われてるものを簡単に変えられるわけがない。
UTF32が21bitコードになってしまったのはUTF-8のせいだ
21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

613デフォルトの名無しさん2019/09/01(日) 13:11:25.72ID:xmxF7u0H
異体字セレクタが導入されたのは別にコードポイントが足りないからじゃないだろ。
異体字なんて数が限られているし、それ以上に役に立たない絵文字をバンバン追加している状況だし。

614デフォルトの名無しさん2019/09/01(日) 13:35:49.57ID:JCPxJyAV
MSがUTF-16を採用したせいで廃止しようにもできないだろ
CP932とSJISとUTF16が生き残ってるのもだいたいこいつのせいだ

615デフォルトの名無しさん2019/09/01(日) 13:40:59.73ID:kCJZVLuH
>>612
おまいもかなり可笑しいなω

616デフォルトの名無しさん2019/09/01(日) 13:42:43.07ID:k0czTyLP
>>612
>まずUTF-16という仕様にはサロゲートペアが最初から含まれてる

あれ、そうだった? だとしたら、UTF16は最初から破綻していたってことだな。
変なものを作らずにUTF32を導入すべきだった。

>UTF32に完全移行って何を移行するっていうんだ?互換性がないんだから
>既に使われてるものを簡単に変えられるわけがない。

シフトJISからUnicodeへも互換性がないのに移行が進んだだろ。

>UTF32が21bitコードになってしまったのはUTF-8のせいだ

UTF8は可変長だから、32ビットでも表そう思えば表せる。
21ビットになったのはUTF16のせい。

>21bitあれば209万7152文字を表現できるんだから異字体セレクタなしで十分収録できる

収録した記号は他にも色々あるし、U+F0000〜U+10FFFFは外字領域だし、
21ビットだけでは心許ない。

>>613
異字体セレクタは同じコードでもAdobe-Japan1とMoji_Johoで字体が違う
滅茶苦茶な欠陥規格だから、さっさと廃止した方が良い。

617デフォルトの名無しさん2019/09/01(日) 14:01:22.04ID:JCPxJyAV
(もしかして: フォント)

618デフォルトの名無しさん2019/09/01(日) 14:17:44.56ID:Cv4S4gQH
>>616
> UTF8は可変長だから、32ビットでも表そう思えば表せる。
無理。UTF-8は「自由に可変にできる文字コード」ではない。
ビットパターンが決まっていて最大21bitまでしか表現できない

619デフォルトの名無しさん2019/09/01(日) 14:29:25.97ID:k0czTyLP
>>618
原理的にはUTF8は「自由に可変にできる文字コード」で32ビットも表せる。
UTF16の制約で符号空間が21ビットのU+10FFFFまでと定められたから、
UTF8もそれを超えるコードを規格外とみなすようにしただけ。

620デフォルトの名無しさん2019/09/01(日) 14:38:49.28ID:5y1tL0M+
>>619
エンコードと文字コードを混ぜんな
おまえみたいな奴がいるから混乱するんだよ
少しは馬鹿を自覚して黙ってろ

621デフォルトの名無しさん2019/09/01(日) 15:12:24.21ID:VpClr4jS
>>614
JavaやJavaScriptの内部エンコーディングもUTF-16だが

622デフォルトの名無しさん2019/09/01(日) 15:24:13.07ID:Cv4S4gQH
>>614
MSがSJISやめたら、世の中の既存の文書が
UTF8にでも変わると思ってんの?
魔法ですか?www

623デフォルトの名無しさん2019/09/02(月) 15:56:23.21ID:8MncpZHQ
魔法(圧力)

624デフォルトの名無しさん2019/09/02(月) 16:24:11.77ID:KSSQVEnP
>>623
どこからの?
セブンイレブンとか?

625デフォルトの名無しさん2019/09/02(月) 22:33:53.67ID:8MncpZHQ
マジレスするとOOXMLとかXPSとか「ある程度便利だけど既存の規格で十分じゃない?」というMS独自規格を、
MSが企業に圧力を掛けたりして広めてきた歴史を言ってるんじゃなかろうか。
念の為言っておくとOOXML←OpenDocument、XPS←PDFね。

626デフォルトの名無しさん2019/09/03(火) 00:26:14.39ID:EcUF0HHf
そんな圧力あったかなあ

627デフォルトの名無しさん2019/09/03(火) 06:39:22.40ID:KovswbEV
>>625
所でLinuxもデスクトップ環境も
一つに統一したほうが良いのではないか?ん?

628デフォルトの名無しさん2019/09/03(火) 08:49:15.73ID:/ybqtULG
MSがXPSを作った時、まだPDFは標準規格化されてなかったはずだが
それにPDFの競合規格はXPS以外にもたくさんある

https://ja.wikipedia.org/wiki/Portable_Document_Format#PDF%E3%81%AE%E7%AB%B6%E5%90%88%E8%A6%8F%E6%A0%BC

629デフォルトの名無しさん2019/09/03(火) 10:21:51.94ID:KovswbEV
PDFはアドビのプロプラフォーマットってイメージが抜けないw

630デフォルトの名無しさん2019/09/03(火) 10:34:53.29ID:gWEsYspA
JavaだってSunのプロプラ言語だぞ

6316672019/09/03(火) 12:40:23.25ID:JzHlK+VD
今は違うけどね

632デフォルトの名無しさん2019/09/03(火) 15:04:07.63ID:jfAsT/N5
そのうち「MSはUnicodeを潰すためにCP932を作った」とか言い出す奴が出てくる

633デフォルトの名無しさん2019/09/03(火) 15:40:05.81ID:KovswbEV
Windowsの内部でCP932に依存している。
英語版Windowsも含めて日本語文字コードが内部で使われている
って思ってるやつは本当にいる

634デフォルトの名無しさん2019/09/03(火) 16:56:31.60ID:MR8tgZNH
>>627
LinuxはWindowsとは思想がほぼ真逆だからね。
多様性を重んじる。俺はそっちのほうが好きかな。
でもそれを至高とするあまり,古いカーネルや別の派生版との互換性が,Windowsのそれらに比べてない。

635デフォルトの名無しさん2019/09/03(火) 16:58:35.78ID:MR8tgZNH
>>628
当時PDFは国際標準にこそなってなかったが,
オープンフォーマットだったし,様々な場面で使われてた。
ただ描画ソフトがクソ重たいのしかなかった記憶がw

636デフォルトの名無しさん2019/09/03(火) 17:26:28.25ID:KovswbEV
>>634
だから多様性を重んじるっていうのは
競合するフォーマットが複数できるってことで
(例えば画像フォーマットや圧縮フォーマット)
Microsoftが独自フォーマットを作るのと同じ思想なんだよ

637デフォルトの名無しさん2019/09/03(火) 17:35:15.54ID:KovswbEV
>>635
> オープンフォーマットだったし
PDFはオープンではありませんでした。
プロプライエタリだって言ってるだろ

638デフォルトの名無しさん2019/09/03(火) 19:23:12.90ID:i0SweFPn
>>633
いつの知識なのかw

Windowsは表面的にはSJISで、内部ではUTF-16だ。

639デフォルトの名無しさん2019/09/03(火) 19:25:28.03ID:KovswbEV
> Windowsは表面的にはSJISで
ほらな、SJISじゃないって言ってんのにSJISだっていう
潜在意識レベルでそう思い込んでるから治しようがないw

640デフォルトの名無しさん2019/09/03(火) 19:51:10.42ID:9BNoj6TJ
WindowsというよりWindowsアプリが特定のOEMコードページやANSIコードページに決め打ちして作られてる物があるということだろ
他言語の状況は知らんけど日本語以外でも似たようなものだろうな

641デフォルトの名無しさん2019/09/03(火) 21:04:34.10ID:VgehgunL
Linuxの思想自体は多様性を重んじるのかもしれんが、ユーザーはそれに反して
「UTF-8以外死ね」みたいに言う奴多いよな。

642デフォルトの名無しさん2019/09/03(火) 21:08:34.33ID:KovswbEV
そうはいってもLinuxはASCIIと互換性がない文字コード(例 UTF-32)は死ねだからw
影響範囲が大きすぎて、LinuxはUTF-16とかUTF-32には事実上対応できないんだよね

643デフォルトの名無しさん2019/09/03(火) 21:51:19.99ID:kvsGhJj2
文字集合を符号化するのは、文字の区切れが判断できないからって解釈してんだけどあってる?

644デフォルトの名無しさん2019/09/03(火) 22:15:09.34ID:18+sQUYN
>>634
>多様性を重んじる。俺はそっちのほうが好きかな。

ところでホモにつきまとわれたらどうする?

645デフォルトの名無しさん2019/09/04(水) 01:38:53.56ID:Gs/bLtCt
一橋大学アウティング事件でググれ

646デフォルトの名無しさん2019/09/04(水) 04:00:00.76ID:xGPrnpMI
>>644
ホモであることは否定しないが、ホモは嫌いという俺の感情も尊重していただきたい
これが多様性だ!

647デフォルトの名無しさん2019/09/04(水) 09:16:30.39ID:n47u8TF1
>>645
ホモにつきまとわれて困ると友人にこぼしたら、
性癖を暴露されたとか言われて更に嫌がらせで自殺された事件?
ああいうの見てると、ホモの権利拡大とかしちゃいかんよなって思うよなあ

648デフォルトの名無しさん2019/09/04(水) 18:11:05.05ID:gX5VYMvu
>>639
Windowsが作るシステムファイルもSJISですよ?

649デフォルトの名無しさん2019/09/04(水) 18:12:22.94ID:vwhL3cv7
>>648
そういうネタはいらんから

650デフォルトの名無しさん2019/09/04(水) 18:52:19.95ID:gX5VYMvu
>>649
延々と嘘を書くのはやめてもらえませんか?

651デフォルトの名無しさん2019/09/04(水) 19:01:15.19ID:vwhL3cv7
ネタにネタをかぶせてもつまらんで

652デフォルトの名無しさん2019/09/04(水) 19:24:35.38ID:gX5VYMvu
妄想か

653デフォルトの名無しさん2019/09/04(水) 22:41:17.45ID:n47u8TF1
まあWindowsはNTカーネルとは限らないからな

654デフォルトの名無しさん2019/09/05(木) 00:35:42.74ID:rtvg+Hab
>>653はNTカーネルに限ると完全Unicode対応って意味やで

655デフォルトの名無しさん2019/09/05(木) 00:50:59.59ID:5i/MxHnj
ここでUnicodeといっちゃうあたりの頭の弱さよ

656デフォルトの名無しさん2019/09/05(木) 01:09:51.35ID:rtvg+Hab
補足すると、Unicodeは文字列集合で
符号化方式がUTF-16やUTF-8など
どの符号化方式であってもUnicodeといえる

>>655
さて、何か言い返したい言葉は有るかね?

657デフォルトの名無しさん2019/09/05(木) 01:11:05.81ID:rtvg+Hab
どうせ言い返す言葉は無いだろうから
待ってても時間の無駄なので先に言っておくと
何も言わない or 捨て台詞はくだけ なら俺に喧嘩売らなければいいのにw

658デフォルトの名無しさん2019/09/05(木) 04:37:49.32ID:5ZYYoPpa
完全Unicode対応ならどの符号化方式も対応してなきゃダメだろ

659デフォルトの名無しさん2019/09/05(木) 05:59:20.80ID:rtvg+Hab
※ LinuxはUTF-16、UTF-32に対応していません

660デフォルトの名無しさん2019/09/05(木) 06:00:04.95ID:rtvg+Hab
※ MacもUTF-16、UTF-32に対応していません

661デフォルトの名無しさん2019/09/05(木) 06:48:35.75ID:5ZYYoPpa
他者を貶めたところで>>654が真実になることはない

662デフォルトの名無しさん2019/09/05(木) 06:54:53.66ID:rtvg+Hab
他者を貶めるってなんのこと?

663デフォルトの名無しさん2019/09/05(木) 07:53:38.03ID:5ZYYoPpa
>>662
NTカーネル以外のものは他者だろ

664デフォルトの名無しさん2019/09/05(木) 08:02:45.45ID:rtvg+Hab
じゃあNTカーネルに限ってはUnicodeっていうのは正しいってこと?

665デフォルトの名無しさん2019/09/05(木) 12:58:50.41ID:5R9ffMew
どーしても我流を貫きたいんだなw
まあ他人の人生だから干渉するつもりはないが,そういう生き方は苦労すると思うぞ?

666デフォルトの名無しさん2019/09/11(水) 17:58:19.49ID:quHYHgkx

667デフォルトの名無しさん2019/09/12(木) 12:27:59.62ID:umd/llTn
全然関係ないけどWPへのリンクはMWの短縮URLが使える。
https://w.wiki/8Ew

668デフォルトの名無しさん2019/09/12(木) 12:43:49.99ID:vEKot6kT
本当に短縮したいところは日本語ページのパーセントエンコードされたところだがうまくいかないもんだな

669デフォルトの名無しさん2019/09/13(金) 09:23:49.73ID:rpBkWpcK
日本語のページも短縮URLにできるんだけど,そうじゃなくて?

670デフォルトの名無しさん2019/09/13(金) 10:11:35.77ID:wKEqF87n
文字通り文字コードのエンコードを間違えてるんだろう

671デフォルトの名無しさん2019/09/13(金) 16:18:49.47ID:nYKvQkSU
[%E5は無効なエンコードです。メインページに戻る。]

672デフォルトの名無しさん2019/09/13(金) 17:19:54.63ID:PF759nqS
当たり前だけど問題ないな
https://w.wiki/8Hy

673デフォルトの名無しさん2019/09/14(土) 00:14:10.89ID:UZ9Fxxpp
これ使われた順に生成されていくの?
そのうち4文字になるんかな

674デフォルトの名無しさん2019/09/14(土) 00:23:57.48ID:FV8dJ/wR
絵文字などサロゲートペアが必要な領域をUTF-7で表現するとUTF-32よりもバイトサイズが大きくなる。まめな。

675デフォルトの名無しさん2019/09/14(土) 11:56:27.23ID:mIZ3m5oP
utf-7が使われてる環境とかデータとか出会ったことが無い

676デフォルトの名無しさん2019/09/15(日) 03:21:10.57ID:TEajZO+5
見せたろか

677デフォルトの名無しさん2019/09/15(日) 04:11:30.07ID:LMFjfaUx
見せて!

678デフォルトの名無しさん2019/09/15(日) 04:14:52.61ID:vhYJbDpr
utf7ってasciiじゃないっけ?

679デフォルトの名無しさん2019/09/15(日) 05:00:59.65ID:cvkFPip1
ここにはない

680デフォルトの名無しさん2019/09/15(日) 10:05:21.58ID:tu3q64lr
>>678
違う

君の理屈だと中国はチベットの一部ということになる

681デフォルトの名無しさん2019/09/16(月) 06:54:09.51ID:vTAkg/qq
じゃ,そういうことじゃん

682デフォルトの名無しさん2019/09/21(土) 16:46:43.93ID:7QW0JGF+
UTF-8もUTF-7も「ASCII互換にしようと思えばできる」文字符号化方式で
UTF-16/32は端から過去互換性を捨ててるっていう理解OK?

683デフォルトの名無しさん2019/09/21(土) 17:12:22.41ID:icgczTg/
互換の意味判ってるか?

684デフォルトの名無しさん2019/09/21(土) 17:13:19.94ID:AMltcnvP
>>682
ちゃんと仕様読め

685デフォルトの名無しさん2019/09/22(日) 02:18:18.82ID:tTe+mIIa
>>682
意味がわからない

686デフォルトの名無しさん2019/09/22(日) 11:35:45.78ID:LQCFANDg
>>682
OK

687デフォルトの名無しさん2019/09/22(日) 12:48:42.82ID:Uxh+z88Q
684デフォルトの名無しさん2019/09/21(土) 17:13:19.94ID:AMltcnvP
>>682
ちゃんと仕様読め

685デフォルトの名無しさん2019/09/22(日) 02:18:18.82ID:tTe+mIIa
>>682
意味がわからない

686デフォルトの名無しさん2019/09/22(日) 11:35:45.78ID:LQCFANDg
>>682
OK

----
どういうことなの…

688デフォルトの名無しさん2019/09/22(日) 15:28:59.04ID:yDiw/0G9
教訓:5chで情報収集するな

689デフォルトの名無しさん2019/09/22(日) 21:23:59.11ID:rg/me2jP
互換って何なの

690デフォルトの名無しさん2019/09/22(日) 22:18:40.20ID:sBc79exV
揚げ足取り終了。

質問。皆さんが普段使っている文字コード変換ライブラリでおススメはなんですか。

691デフォルトの名無しさん2019/09/22(日) 23:28:10.21ID:JTFkWMft
お勧めもなにもiconvかICUで大体用は足りる
それで満足しなきゃ自分で作るしかない

692デフォルトの名無しさん2019/09/23(月) 08:58:26.51ID:10n0KRvd
文字コードの変換だけ?
いまどきのまともな言語環境なら変換元のエンコーディングさえ分かってれば標準機能で出来るだろうに
それとも全角⇔半角の変換みたいなのをやりたいってこと?

693デフォルトの名無しさん2019/09/23(月) 11:35:21.05ID:3qdqqJ07

694デフォルトの名無しさん2019/09/23(月) 14:54:10.02ID:FPxFvDjY
Windows SDK付属のデバッグ用ソースを見たところmbstowcs_sの文字コード変換は、Win32APIであるMultiByteToWideCharを使っているようですね。

695デフォルトの名無しさん2019/09/23(月) 15:08:29.22ID:3qdqqJ07
MultiByteToWideChar / WideCharToMultiByte 最強

696◆QZaw55cn4c 2019/09/23(月) 15:53:59.08ID:ZLX7TvLd
>>695
確かに便利でありがたかったです
http://2chb.net/r/tech/1434079972/53

697デフォルトの名無しさん2019/09/23(月) 16:01:34.44ID:51KZjw6P
null-terminatedとそうでない場合の仕様の違いをちゃんと理解してなくて
バグった挙句によけいな1byte追加しちゃったりした思い出。

698デフォルトの名無しさん2019/09/23(月) 16:24:42.75ID:3qdqqJ07

699デフォルトの名無しさん2019/09/24(火) 00:23:12.23ID:FsJR6FDp
長い上にださい略し方だ…

700デフォルトの名無しさん2019/09/24(火) 14:25:04.46ID:oiN+60ax
python3でlogging使ってsyslogに出力すると
ASCIIで出力してもなぜか最後に\0が付いてログが残る
鯖側のsyslogdの方で付いてるのかと思ったが
そうじゃなくてpython3が勝手に付けてるみたい
python3のstringがunicode化したときにバグ入ったんかな
python2のときはそんなこと無かった気がする

701デフォルトの名無しさん2019/09/25(水) 12:14:01.12ID:9XZAk7bA

702デフォルトの名無しさん2019/09/25(水) 13:11:07.39ID:BmMtZLRv
深い闇を垣間見た気がする

handler.log_format_string = '<%d>%s'
だと no attribute

handler.setFormatter(logging.Formatter('%(message)s'))
だと結局 \0 付いたままでした

703デフォルトの名無しさん2019/09/25(水) 13:18:01.66ID:BmMtZLRv
コンストラクタ呼ぶ前に
logging.handlers.SysLogHandler.append_nul = False
で解決しました
thx!

704デフォルトの名無しさん2019/09/25(水) 14:09:59.51ID:sdHp2tVC
エンコードされた文字のバイト並びが
utf-8 と cp832 で同じ(にみえる)ものってどんなのがあります?
そもそも 3bytes と 2bytes なのは仕方ないのですが
utf-8 だと (xx yy zz)
みたいなのが
cp932 だと (xx yy) 00
逆に
cp932 だと (uu vv) (ww xx) (yy zz)
みたいなのが
utf-8 だと (uu vv ww) (xx yy zz)
みたいなのでも良いです
そもそもありえない?

705デフォルトの名無しさん2019/09/25(水) 14:11:59.88ID:cBdVtg+x
cp932 ってことはいわゆる半角カナも入れて良いのカナ

706デフォルトの名無しさん2019/09/25(水) 14:14:32.79ID:sdHp2tVC
出来れば「美乳」みたいなクオリティ高いのが良いです

707デフォルトの名無しさん2019/09/25(水) 16:32:05.43ID:vuS5tsH7
美乳ってどういう特長を持ってたんだっけ?
エージェントが読み込んだときに確実にShift JISだって判定できるんだっけか。

708デフォルトの名無しさん2019/09/25(水) 23:44:33.31ID:2M81F3EH
PC初心者です。
あるexeファイルをコマンドウインドウで開く。ということをしなきゃならないんだけどシフト+右クリックしてもコマンドウインドウで開くというのがありませんでした
調べたら、コマンドウインドウで開くを表示したい場合メモ帳で名前を付けて保存の時に文字コードをUnicodeにして保存し実行したらレジストリがどうたら書いてあったんでしようとしたら、文字コードにUnicodeがありませんでした。
どうしたら良いですか?

709デフォルトの名無しさん2019/09/26(木) 00:04:19.37ID:Gir9qHZJ
↓最高に面白い回答

710デフォルトの名無しさん2019/09/26(木) 00:06:20.67ID:1IaRoLf+
>>708
>どうしたら良いですか?

諦める
高望みするから人間は苦しむんだよ

711デフォルトの名無しさん2019/09/26(木) 01:58:07.64ID:MW37nPtB
>>704
ASCII以外ではたぶん無いんじゃないかな
cp932としてもutf-8としても正しいバイト列で
それぞれが別の単語になるケースを探したことがあるけど、
それでも両方が意味のある単語になる例は見つけられかった

どういう目的でそういう例を探してるの?

712デフォルトの名無しさん2019/09/26(木) 08:30:15.09ID:NQV5DCT+
>>708
cmdにd&dかバッチファイル作れ
これ以上はスレチ

713デフォルトの名無しさん2019/10/08(火) 14:05:40.55ID:yxEiS4UK
ブログラムソースをUTF16やUTF32で書いてる人いるの?
ブログラム内の文字列のデータじゃなくてブログラムの地の部分

714デフォルトの名無しさん2019/10/08(火) 14:10:33.38ID:J68M6wrj
そんなゴリホーモおらんやろ

715デフォルトの名無しさん2019/10/08(火) 15:33:52.08ID:Dgw8eufS
誰が読むんだ

716デフォルトの名無しさん2019/10/23(水) 21:57:19.58ID:CiGuyy89
まるでUTF-16文書は読むのに向かないかのような発言やな
まともなエディタなら読めて当然。

717デフォルトの名無しさん2019/10/23(水) 23:42:00.06ID:/s0IRa9G
ICUなんてほぼほぼUTF-16ですよ。

718デフォルトの名無しさん2019/10/24(木) 17:29:35.02ID:mthfJT/n
なんかUnicodeのサイト分裂した?

719デフォルトの名無しさん2019/10/24(木) 18:37:57.14ID:FCkKS+Hu
青っぽいデザイン変更で入口が使いにくくなってる辺り?

720デフォルトの名無しさん2019/10/27(日) 00:29:12.62ID:DVVulqOc
なにそれこわい

721デフォルトの名無しさん2019/10/29(火) 16:20:42.34ID:A7Naqht0
https://home.unicode.org/#
これやな。
なんか謎の意匠がw

722デフォルトの名無しさん2019/11/01(金) 01:07:36.40ID:iOCNEHbC
結局見つかったのは何なの

723デフォルトの名無しさん2019/11/01(金) 01:07:53.40ID:iOCNEHbC
書くとこ間違えた失礼


lud20191103003743
このスレへの固定リンク: http://5chb.net/r/tech/1544931495/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

TOPへ TOPへ  

このエントリをはてなブックマークに追加現在登録者数177 ブックマークへ


全掲示板一覧 この掲示板へ 人気スレ | Youtube 動画 >50 >100 >200 >300 >500 >1000枚 新着画像

 ↓「文字コード総合スレ Part12 ->画像>17枚 」を見た人も見ています:
文字コード総合スレ Part12
文字コード総合スレ Part11
文字コード総合スレ Part10
文字コード総合スレ part13
文字コード総合スレ part15
コンパクトキーボード総合スレ Part12
コンパクトキーボード総合スレ Part13
全国交通系ICカード総合スレ Part19 【10種相互】
【TREK】トレック ロード総合スレ Part107【ROAD】
【TREK】トレック ロード総合スレ Part109【ROAD】
【TREK】トレック ロード総合スレ Part109【ROAD】
【TREK】トレック ロード総合スレ Part103【ROAD】
【TREK】トレック ロード総合スレ Part105【ROAD】
【TREK】トレック ロード総合スレ Part110【ROAD】
【TREK】トレック ロード総合スレ Part107【ROAD】
AGPビデオカード総合スレ Part32
ナゴムレコード総合スレ Part2
AGPビデオカード総合スレ Part33
【FF14】24人レイド総合スレ Part10
【FF14】24人レイド総合スレ Part10
【TREK】トレック ロード総合スレ Part98【ROAD】
【TREK】トレック ロード総合スレ Part94【ROAD】
コンパクトキーボード総合スレ Part10
【TREK】トレック ロード総合スレ Part115【ROAD】
【TREK】トレック ロード総合スレ Part121【ROAD】
【TREK】トレック ロード総合スレ Part113【ROAD】
全国ICカード総合スレ Part13 【10種相互利用】 [無断転載禁止]
全国ICカード総合スレ Part15 【10種相互利用】 [無断転載禁止]
全国ICカード総合スレ Part15 【10種相互利用】 [無断転載禁止]
キーボード総合スレ Part2
【FF14】24人レイド総合スレ Part4
【FF14】24人レイド総合スレ Part3
【FF14】24人レイド総合スレ Part5
Just Cause/ジャストコーズ 総合スレ Part10
【FF14】24人レイド総合スレ Part14
【FF14】24人レイド総合スレ Part15
【FF14】24人レイド総合スレ Part16
【FF14】24人レイド総合スレ Part16
【TREK】トレック ロード総合スレ Part84【ROAD】
【TREK】トレック ロード総合スレ Part75【ROAD】
【TREK】トレック ロード総合スレ Part85【ROAD】 [無断転載禁止]
【TREK】トレック ロード総合スレ Part92【ROAD】 [無断転載禁止]
【FF14】ヴォイドアーク・クリスタルタワー 24人レイド総合スレ Part1 [無断転載禁止]
抱き枕総合スレ Part12
女子体操総合スレ PART12
ハロプロ研修生総合スレ Part1202
ハロプロ研修生総合スレ Part1512
ハロプロ研修生総合スレ Part1312
ハロプロ研修生総合スレ Part1252
ハロプロ研修生総合スレ Part1292
ハロプロ研修生総合スレ Part1282
ハロプロ研修生総合スレ Part1762
ハロプロ研修生総合スレ Part1302
ハロプロ研修生総合スレ Part1212
ハロプロ研修生総合スレ Part1642
ハロプロ研修生総合スレ Part1372
ハロプロ研修生総合スレ Part1242
【猫だけ】 猫についての総合スレ Part12
【LoL】日本人・LJL総合スレ Part162
【LoL】日本人・LJL総合スレ Part132
【Nintendo Switch】総合スレ part12
Samsung Galaxy Note9 総合スレ Part12
お掃除ユニットCLEAR'S総合スレ Part12
17:42:57 up 25 days, 4:07, 1 user, load average: 9.03, 9.64, 9.49

in 0.044748067855835 sec @0.044748067855835@0b7 on 010607