hack のためのネタ帳, etc,,,

タグ検索でutf-810件見つかりました。

20210629: Cygwin - win32 バイナリと文字化け

nd-line-unicode-and-utf-8-output-text-buffer/]] - Microsoft / Docs / Windows / [[Console>https://docs.microsoft.com/en-us/windows/console/]] - [[mintty>https://mintty.github.io/]] / wiki -- Tips # [[Input/Output interaction with alien programs>ht…

https://seesaawiki.jp/w/kou1okada/d/20210629%3a%20... - 2021年06月30日更新

20180906: GNU R - マルチバイト文字列処理

* マルチバイトの文字列処理が出来ない 以下のような状態 =|| > grep("o", c("hage", "hige", "huge", "hege", "hoge", "foo", "bar")) [1] 5 6 > grep("あ", c("あいうえお", "かきくけこ", "さしすせそ")) [1] 1 > grep("か", c("あいうえお", "かきくけこ", "さしすせそ")) [1] 2 > grep("い", c("あいうえお", "かきくけこ", "さしすせ…

https://seesaawiki.jp/w/kou1okada/d/20180906%3a%20... - 2019年02月05日更新

20210105: nkf - BOM の追加削除

* やりたい事 UTF-8 のファイルに BOM を追加削除したい。 * 方法 nkf で以下のオプションを使うと楽なようだ。 - --overwrite[=SUF] : timestamp を維持して上書き(維持したくない場合は --in-place[=SUF]) - --oc= : 出力コードの指定 BOM の追加 =|| nkf --overwrite --oc=UTF-8-BOM ||= BOM の削除 =|| nkf --overwrite --oc=UTF-8 ||= * 参…

https://seesaawiki.jp/w/kou1okada/d/20210105%3a%20... - 2021年01月05日更新

20200106: Cygwin - Windows CUI Command and MBCS

以下のような tweet を見かけた &twitter(1210731211775102977) 試してみると =|| $ cmd /c help type テキスト ファイルまたはファイルの内容を表示します。 TYPE [ドライブ:][パス]ファイル名 ||= =|| $ cmd /c help type | nkf --guess Shift_JIS (CRLF) ||= =|| $ echo ほげ | nkf --guess UTF-8 (LF) ||= えー!!!凄い 以前から、cmd.ex…

https://seesaawiki.jp/w/kou1okada/d/20200106%3a%20... - 2020年01月06日更新

20190925: Docker - MySQL - UTF-8

docker_mysql_latin1_utf-8]] - Qiita / @kazuyoshikakihara / 2018-02-13: [[Dockerではコンテナのlocaleの再確認を>https://qiita.com/kazuyoshikakihara/items/0cf74c11d273b0064c83]] * 関連 - [[Docker - MySQL]]…

https://seesaawiki.jp/w/kou1okada/d/20190925%3a%20... - 2019年09月25日更新

20190108: C++ - char8_t

* 経緯 以下の記事を見つけた - Qiita / yumetodo / 2019-01-05: [[C++標準化委員会、ついに文字とは何かを理解する: char8_t>https://qiita.com/yumetodo/items/54e1a8230dbf513ea85b]] C++ Advent Calendar 2018 15日目の記事 素晴らしいまとめ。 そして、Unicode、Character.GetGraphemeBreakPropertyV10.cs とか最早地獄絵図だな。 江添…

https://seesaawiki.jp/w/kou1okada/d/20190108%3a%20... - 2019年01月08日更新

20190222: Cygwin - ターミナルエミュレータと文字化け

* ネタ元 以下のような記事を見かけた。 &twitter(1098752792955564033) - Qiita / javacommons / 2017-12-09: [[Cygwin で Windows標準の ping や nslookup を使う (nkf を使わないでシフトJISの出力をUTF-8に変換する方法)>https://qiita.com/javacommons/items/15fe76491eced93ec58b]] 因みに、ネタ元の本題である Cygwin から MBCS…

https://seesaawiki.jp/w/kou1okada/d/20190222%3a%20... - 2019年02月22日更新

upTeX - upjcode

* 公式ページ等 - TeX Alchemist Online / 2015-02-18: [[upTeX で文字コード情報を調べる upjcode パッケージ>http://doratex.hatenablog.jp/entry/20150218/1424257261]] * ネタ元 &twitter(568105100679340033){theme:light} …

https://seesaawiki.jp/w/kou1okada/d/upTeX%20%2d%20... - 2015年02月24日更新

Cygwin - sjiswrapper

日本語版 Windows だと ping とか traceroute とかが軒並み SJIS (と言うか CP932 ?)出力なので UTF-8 環境で使ってる cygwin だと片っ端から文字化けして困る。 以下のようなラッパーを書いて、目的のコマンド名にリネームなりシンボリックリンクなりしておくと幸せになれる sjiswrapper.iconv =|SH| #!/bin/sh CMD="${0##*/}.exe" ("$CMD" "$@" 3>&1 1>&2 2>&3 | icon…

https://seesaawiki.jp/w/kou1okada/d/Cygwin%20%2d%2... - 2013年03月21日更新

UTF-8 - 濁音・半濁音

Mac を経由すると困ったことに濁音・半濁音が2文字に分離されてる場合があるらしく、 PostgreSQL 等にそのまま食わせると EUC-JP に変換出来ない等の弊害が生じる模様。 Excel から xyzzy にテキストを貼り付けた場合も文字化けが生じた。 どっちが正しいあり方なのかは知らないが、こういう基本的な部分で互換性がないのは甚だ迷惑な話だ。 * 1文字化 [+] 0, // 分離濁音? "\xe3\x82\x9a" /* ゜ */ => 1, // 分離半濁音? //…

https://seesaawiki.jp/w/kou1okada/d/UTF%2d8%20%2d%... - 2011年04月14日更新

ai(22) android(29) bash(40) c++(52) cxx(54) cygwin(128) debian(39) deeplearning(32) diary(766) excel(21) font(30) free-book(47) git(21) github(28) gnu-r(77) google(26) hdd(22) html(25) java(26) javascript(121) keyboard(21) latex(57) lcd(22) library(24) linux(97) machinelearning(31) memo(463) microsoft(42) oss(25) pdf(38) powershell(65) programming(32) proxy(24) python(100) r-lang(47) ruby(86) security(72) ssh(34) tex(37) tips(398) troubleshooting(443) ubuntu(114) unicode(22) usb(21) virtualization(24) vscode(29) windows(127) windows10(50) wsl(26) zfs(32)

管理人/副管理人のみ編集できます