2008年6月23日星期一

前のいい部屋がなくなる、

毛見つかった部屋がでめだ。保証者がないと、以前の努力が不意になる。まあ、まあ、新しい部屋を探しましょう。

2008年6月22日星期日

acc格式文件的说明,手机用的

AAC(Advanced Audio Coding)实际上是高级音频编码的缩写,AAC是由Fraunhofer IIS-A、杜比和AT&T共同开发的一种音频格式,它是MPEG-2规范的一部分。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他的功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(比如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多种采样率和比特率、多种语言的兼容能力、更高的解码效率。总之,AAC可以在比MP3文件缩小30%的前提下提供更好的音质,被手机界称为“21世纪数据压缩方式”。 因为“AAC”是一个大家族,他们是共分为9种规格,以适应不同场合的需要: a) MPEG-2 AAC LC 低复杂度规格 (Low Complexity) b) MPEG-2 AAC Main 主规格 c) MPEG-2 AAC SSR 可变取样率规格 (Scaleable Sample Rate) d) MPEG-4 AAC LC 低复杂度规格(Low Complexity),现在的手机比较常见的MP4文件中的音频部份就包括了该规格音频文件 e) MPEG-4 AAC Main 主规格 f) MPEG-4 AAC SSR 可变取样率规格 (Scaleable Sample Rate) g) MPEG-4 AAC LTP 长时期预测规格(Long Term Predicition) h) MPEG-4 AAC LD 低延迟规格(Low Delay) i) MPEG-4 AAC HE 高效率规格(High Efficiency) 上述的规格中,主规格“Main”包含了除增益控制之外的全部功能,其音质是最好,而低复杂度规格则是比较简单,没有了增益控制,但提高了编码效率,至“SSR”对“LC”规格大体是相同,但是多了增益的控制功能,另外,MPEG-4/AAC/LTP/LD/HE,都是用在低码率下编码,特别是“HE”是有Nero ACC编码器支持,是近来多用的一种编码率种,不过通常来说,Main规格和LC规格的音质相差是不大,因此目前使用最多的AAC规格多数是“LC”规格,因为要考虑手机目前的内存能力未达合理水平。 由于AAC格式家族比较庞大,要了解他,首先要清楚其各有不同的编码器,在目前是包括了商业的,免费的 AAC 格式音频编码器,其中几个主要的有如下 : a) FhG Fraunhofer IIS研发的权威编码器,拥有很好的音质,可惜不对外开放了。 b) Nero AAC可能是目前最完美的AAC编码器了,(千千静听就是用的此编码器)同时支持"LC AAC/HE AAC"规格,Nero AAC编码器提供了品质最好的"VBR LC AAC"格式,同时亦对面"HE AAC"规格保证了在低码率下也有良好的表现,目前索尼爱立信W800和K750等手机都支持该编码器。 c) QuickTime/iTune Apple公司的两款Media软件都提供了AAC编码功能,其编码技术来自“DolbyLaboratories”,是目前音质最好的中码编率编码器,它编码的48kbps立体声音质比其它AAC编码器好20 - 25%,甚至64 kbps的Dolby AAC音效可媲美128 kbps的MP3。 d) FAAC也是一种很好的命令行编码器,只支持“LC”规格,但音质相当不错,与一般商业用的编码器接近水平,而这个软件更是免费来的,索尼爱立信W800和K750等手机也是同样支持这个编码器。 另外还有Psytel,Coding Technologies,HHI/z Plane(Compaact),Dolby AAC等AAC编码器,而其它如Panasonic,Nokia,AT&T,NEC等公司也都有独家开发的编码器,在大家弄清楚这些AAC格式音频规格和编码器之后,我们就不难知道为什么同一款Nokia手机会支持看起来都是AAC格式音频的诸多文件格式了,比如Nokia 6230i就是既支持AAC格式也支持M4A格式和MP4格式的机型,而这些音频文件格式其实都是属于AAC家族成员的! WAV(Wave Audio Files)格式是微软公司开发的一种声音文件格式,也叫波形声音文件,其扩展名为.wav。是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,标准的WAV格式文件和CD格式是一样的,因此WAV的音质与CD相差无几。它以RIFF格式为标准。每个WAV文件的头四个字节就是“RIFF”。WAV文件由文件头和数据体两大部分组成,其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。常见的WAV声音文件有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。WAV播放工具:Windows Media Player 和Winamp等都可以。但WAV格式对存储空间需求太大不便于交流和传播。参考资料:http://bbs.my160.com/redirect.php?tid=25398&goto=lastpost

2008年6月21日星期六

新しい部屋を探しました。

今の部屋は、通勤の時間がとっても長いです。毎日、大体二時間がかかります。ろうひしますね、僕にとって、時間がお金より重要です。でも、どうしたらいいかな。今日、新しい部屋を見つかったが、その後、僕と呉さんと毛さんと一緒に晩御飯をたべた。これこそ、僕が一番得意でないことですね。しゃべるとか、冗談を言うとか、僕にとって一番困られることだ。どうしたらいいかとは、わからないといって、実際に、確かにわかると思っている。ほかの方法はないでしょう。できるだけ、しゃべることや会話を練習してしようがないね。

ああああああああああ。本当に難しい、でもしょうがないとは、しょうがない、頑張ってね。

インストール startdict

ステップ:
1。USE="gnome" emerge -av stardict  
2。サイト「http://stardict.sourceforge.net/cn/Dictionaries_ja.php」に行って、辞書ファイルをダウンロードする。
3。tar jxvf stardict-jmdict-ja-en-2.4.2.tar.bz2
4。mv stardict-jmdict-en-ja-2.4.2 /usr/share/stardict/dic/
5。「stardict」を実行する。

the process of emerging gimp

the first time of emerging gimp is failed.
but, after adding "jpeg jpeg2k " to /etc/make.conf, it became normal. so great.

2008年6月20日星期五

また、週末だなあ。。。

今日は、気持ちがいいな。でも、任務があるね。単語がいっぱいまだ暗記しなかった。時間を浪費したら、やっぱくなるね。
じゃ、動かしましょう。

2008年6月19日星期四

朱建电话

朱建电话:13911090603

今日の嬉しいことがあるよ

今日は、毛さんの友達の所に行きました。 冷蔵庫や電子レ−ジやテーブルなどをまらいました。でも、運搬の貯めに、大変になりました。家に帰って、パソコンを開いて、その前に座って、心がいらいらしていました。晩ご飯はまだ食べなかったし、服も洗わなければならないし、また、シャワーや勉強などもしなかった.

ね、時間がないで、必ず早く引越して行く。

2008年6月18日星期三

ExcelのVBAを勉強しました。

今日の仕事の時、仕事をすることなく、Excelのマクロを学習した。これで、仕事を遅らせてしまった。でも、面白い一日を過ごした。

god. my god, 元々、時間がないのに、ただいま、またqqの上で刘恩夫にあいました、彼に履歴書を修正させられた。しょうがないなああああ.。。
ええ。また、ウィンドウズに入らなければならない。

心理学教授谈记忆魔法--艾宾浩斯遗忘曲线

出自http://edu.sina.com.cn/l/2002-11-21/34414.html
  作者:乐国安
  人的大脑是一个记忆的宝库,人脑经历过的事物,思考过的问题,体验过的情感和情绪,练习过的动作,都可以成为人们记忆的内容。例如英文的学习中单词、短语和句子,甚至文章的内容都是通过记忆完成的。从"记"到"忆"是有个过程的,这其中包括了识记、保持、再认和回忆。有很多


人在学习英语的过程中,只注重了学习当时的记忆效果,孰不知,要想做好学习的记忆工作,是要下一番工夫的,单纯的注重当时的记忆效果,而忽视了后期的保持和再认同样是达不到良好的效果的。
  在信息的处理上,记忆是对输入信息的编码、贮存和提取的过程,从信息处理的角度上,英文的第一次学习和背诵只是一个输入编码的过程。人的记忆的能力从生理上讲是十分惊人的,它可以存贮1015比特(byte,字节)的信息,可是每个人的记忆宝库被挖掘的只占10%,还有更多的记忆发挥空间。这是因为,有些人只关注了记忆的当时效果,却忽视了记忆中的更大的问题--即记忆的牢固度问题,那就牵涉到心理学中常说的关于记忆遗忘的规律。
  一、艾宾浩斯记忆规律曲线解释
  德国有一位著名的心理学家名叫艾宾浩斯(Hermann Ebbinghaus,1850-1909),他在1885年发表了他的实验报告后,记忆研究就成了心理学中被研究最多的领域之一,而艾宾浩斯正是发现记忆遗忘规律的第一人。
  根据我们所知道的,记忆的保持在时间上是不同的,有短时的记忆和长时的记忆两种。而我们平时的记忆的过程是这样的:
  输入的信息在经过人的注意过程的学习后,便成为了人的短时的记忆,但是如果不经过及时的复习,这些记住过的东西就会遗忘,而经过了及时的复习,这些短时的记忆就会成为了人的一种长时的记忆,从而在大脑中保持着很长的时间。那么,对于我们来讲,怎样才叫做遗忘呢,所谓遗忘就是我们对于曾经记忆过的东西不能再认起来,也不能回忆起来,或者是错误的再认和错误的回忆,这些都是遗忘。艾宾浩斯在做这个实验的时候是拿自己作为测试对象的,他得出了一些关于记忆的结论。他选用了一些根本没有意义的音节,也就是那些不能拼出单词来的众多字母的组合,比如asww,cfhhj,ijikmb,rfyjbc等等。他经过对自己的测试,得到了一些数据。
  然后,艾宾浩斯又根据了这些点描绘出了一条曲线,这就是非常有名的揭示遗忘规律的曲线:艾宾浩斯遗忘曲线,图中竖轴表示学习中记住的知识数量,横轴表示时间(天数),曲线表示记忆量变化的规律。
  这条曲线告诉人们在学习中的遗忘是有规律的,遗忘的进程不是均衡的,不是固定的一天丢掉几个,转天又丢几个的,而是在记忆的最初阶段遗忘的速度很快,后来就逐渐减慢了,到了相当长的时候后,几乎就不再遗忘了,这就是遗忘的发展规律,即"先快后慢"的原则。观察这条遗忘曲线,你会发现,学得的知识在一天后,如不抓紧复习,就只剩下原来的25%)。随着时间的推移,遗忘的速度减慢,遗忘的数量也就减少。有人做过一个实验,两组学生学习一段课文,甲组在学习后不久进行一次复习,乙组不予复习,一天后甲组保持98%,乙组保持56%;一周后甲组保持83%,乙组保持33%。乙组的遗忘平均值比甲组高。
  二、不同性质材料有不同的遗忘曲线
  而且,艾宾浩斯还在关于记忆的实验中发现,记住12个无意义音节,平均需要重复16.5次;为了记住36个无意义章节,需重复54次;而记忆六首诗中的480个音节,平均只需要重复8次!这个实验告诉我们,凡是理解了的知识,就能记得迅速、全面而牢固。不然,愣是死记硬背,那也是费力不讨好的。因此,比较容易记忆的是那些有意义的材料,而那些无意义的材料在记忆的时候比较费力气,在以后回忆起来的时候也很不轻松。因此,艾宾浩斯遗忘曲线是关于遗忘的一种曲线,而且是对无意义的音节而言,对于与其他材料的对比,艾宾浩斯又得出了不同性质材料的不同遗忘曲线,不过他们大体上都是一致的。
  因此,艾宾浩斯的实验向我们充分证实了一个道理,学习要勤于复习,而且记忆的理解效果越好,遗忘的也越慢。
  三、不同的人有不同的艾宾浩斯记忆曲线--个性化的艾宾浩斯
  上述的艾宾浩斯记忆曲线是艾宾浩斯在实验室中经过了大量测试后,产生了不同的记忆数据,从而生成的一种曲线,是一个具有共性的群体规律。此记忆曲线并不考虑接受试验个人的个性特点,而是寻求一种处于平衡点的记忆规律。
  但是记忆规律可以具体到我们每个人,因为我们的生理特点、生活经历不同,可能导致我们有不同的记忆习惯、记忆方式、记忆特点。规律对于自然人改造世界的行为,只能起一个催化的作用,如果与每个人的记忆特点相吻合,那么就如顺水扬帆,一日千里;如果与个人记忆特点相悖,记忆效果则会大打折扣。因此,我们要根据每个人的不同特点,寻找到属于自己的艾宾浩斯记忆曲线。(作者系南开大学心理学教授 博士生导师)

2008年6月17日星期二

今日、チャットしました、、一級のことは堅持できるかどうかわからない

しょうがない、やらなければならないことがあるよ。フリーの物をもらえるため、毛さんの友達のところに行きました。また、帰った後、刘恩夫とチャットしました、時間をこんなに経た。。 あ、、私は彼の履歴書を修正しました、助けをあげましたなあ。
こころがいたいにしても、しようがない。しょうがないか?・・


泣くほど、いらいらする。。。。。。

让Adobe acroread显示pdf文件中的中文简体、繁体及日、韩字体的方法

出自:http://www.linuxeden.com/forum/thread-70247-1-1.html
如何让在linux下的acroread 看到中文、日文和韩文?
很简单,在安装Adobe的Acrobat Reader之后,再安装相应的字库就可。

中日韩的字库可以到Adobe的网站下载,网址是:
http://www.adobe.com/products/acrobat/acrrasianfontpack.html

或者直接到Adobe ftp下载,地址是:
ftp://ftp.adobe.com/pub/adobe/acrobatreader/unix/5.x

字库文件名是:
中文简体:chsfont.tar.gz
中文繁体:chtfont.tar.gz
日文:jpnfont.tar.gz
韩文:korfont.tar.gz

下载后,解压,然后分别运行./INSTALL文件,再按照屏幕提示安装。
提示输入安装目录的时候,默认的[/opt]就可以,gentoo默认安装目录就是这个。

安装后,重新运行acroread及可。

2008年6月16日星期一

HOWTO 本地化完美解决方案

出自Gentoo Linux Wiki

在AMD64 Sempron(tm) Processor 3000+上进行的测试,目标是英文或中文界面,北京时间,附带中日韩输入法

字体的安装

如果可以的话,下载msyh.ttf并将其copy到/usr/share/fonts/msyh/下,权限644,再在/etc/X11/xorg.conf中 Section "Files" 段添加 FontPath "/usr/share/fonts/msyh" 然后执行fc-cache -f -v ,字体添加完毕

LINGUAS的具体用途

在/etc/make.conf中可以设置LINGUAS,如果设置成LINGUAS="zh_CN" ,那么在firefox,openoffice,kde-i18n...中生成带有中文的空间。

测试:我在编译openoffice时加入了这一选项,结果出来openoffice是中文的(我系统中所有applications均是英文的)。

设置locale

File:/etc/locale.gen

en_US.UTF-8 UTF-8
zh_CN.UTF-8 UTF-8
ja_JP.UTF-8 UTF-8
zh_CN.GBK GBK


要用中文日文输入法zh_CN.UTF-8 UTF-8和ja_JP.UTF-8 UTF-8是少不了的。韩文的ko_KR.UTF-8 UTF-8是少不了的。然后运行locale-gen

测试:我曾在上面的/etc/locale.gen中没有设ja_JP.UTF-8 UTF-8,结果只有中文输入法能用。

还有所有的UTF-8,GBK,GB2312最后都会自动转换成utf8,gbk,gb2312不信你执行locale -a试一下就都明白了。

Why zh_CN.GBK GBK?

加入这一项就是为了能够阅读从Windows那里过来的中文文档。怎么读? Linuxsir gentoo

没有加入gb2312原因是gbk是gb2312的超集,所以gbk就够了。至于gb18030我以前加过,但是从来没有用到过,如果有需要可以视情况而定。

加入/etc/env.d/02locale

File:/etc/env.d/02locale

LANG="en_US.UTF-8"
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"

执行source /etc/env.d/02locale

测试:唯独LC_CTYPE设置成zh_CN.UTF-8,原因是这样设置才会有中文输入法,同时日文输入法也会有,我想韩文大抵也如此。我曾经试过设置成en_US.UTF-8,结果中日输入法均无法使用。

附注:其实在LC_CTYPE=zh_CN.UTF-8 下也可以启动输入发 scim就不用说了 fcitx的启动方法是 env LC_CTYPE=zh_CN.UTF-8 fcitx 就行了 这样就可以不用影响其它程序了 在某些程序中(firefox等)不能切换出输入法的时候可以修改 etc\gtk-2.0\gtk.immodules 文件 将中间的

"/usr/lib/gtk-2.0/2.10.0/immodules/im-xim.so"
"xim" "X Input Method" "gtk20" "/usr/share/locale" "ko:ja:th:zh"

加上 en 就可

"/usr/lib/gtk-2.0/2.10.0/immodules/im-xim.so"
"xim" "X Input Method" "gtk20" "/usr/share/locale" "en:ko:ja:th:zh"

安装输入法

emerge scim scim-pinyin scim-anthy(韩文是scim-hangul.切记要最后emerge)

完成之后在~/.xinitrc和~/.xsession中加入

export XMODIFIERS=@im=SCIM
/*****************特别注意这个地方,我用的fcitx,因为这里搞成了XMODIFIERS="@im=fcitx",导致无法输入中文。具体现象是输入法面板能出来,也能接受鼠标点击,比如半/全角切换、拼音/五笔切换等等,但Ctrl+空格无法切换成蓝色,输入方式那始终灰的。今天才发现这个错误。
另外,我处理环境变量的方式是编辑一个新文件/etc/env.d/99myownstuff,所有全局的环境变量集中到这里设置。内容如下:
jiejie@ysj ~ $ cat /etc/env.d/99myownstuff
#定义LANG和LC_CTYPE,这里我用英文环境,中文输入,编码utf8
LANG=en_US.UTF-8
'LC_CTYPE=zh_CN.UTF-8

#定义fcitx中文输入所需变量
XMODIFIERS='@im=fcitx'
XIM=fcitx
XIM_PROGRAM=fcitx
by ziyouwaYJ 2008-05-30***************/

export GTK_IM_MODULE="scim"
export QT_IM_MODULE="scim"
scim -d
#exec /usr/bin/ssh-agent -- /usr/bin/gnome-session
exec /usr/bin/ssh-agent -- /usr/kde/3.5/bin/startkde

如果你用gnome,就相应的修改一下。.xinitrc是startx时用的,gdm/kdm里的custom session则会调用~/.xsession

配置/etc/conf.d/clock和/etc/rc.conf

File:/etc/conf.d/clock中更改两个参数

CLOCK="local"
TIMEZONE="Asia/Shanghai"

File:/etc/rc.conf中更改两个参数

EDITOR="/usr/bin/vim"
XSESSION="Gnome"

其他参数不要改动

本地时间的设置

系统的时间配置在/etc/conf.d/clock 更改两个设置

CLOCK="local"
TIMEZONE="Asia/Shanghai"

其他的参数不变

方法二

上面的方法会使tty下中文产生乱码,经过讨论,这里提供另一方法。此法好处是不会使一些软件的中文无法显示,同时保持系统的locale的不变。 这种方式只有vim无法显示和输入中文,emacs无法输入中文,其他的都可以。(若你想在vim和emacs下输入中日韩。Command: echo "LC_ALL="en_US.UTF-8"" >/etc/env.d/02locale )我也推荐这种方法。

设置locale

File:/etc/locale.gen

en_US.UTF-8 UTF-8
zh_CN.UTF-8 UTF-8
ja_JP.UTF-8 UTF-8
ko_KR.UTF-8 UTF-8
zh_CN.GBK GBK

运行locale-gen

安装输入法

emerge scim scim-pinyin scim-anthy scim-hangul

在~/.bashrc中添加两行:

export XMODIFIERS=@im=SCIM
export GTK_IM_MODULE="scim"(gnome)
export QT_IM_MODULE="scim"(kde)

重启,一切OK!

locale设定 原因 解释

ps:这是我曾经收录的一篇文章,出处已无从查找,仅作为本篇本地化文章的参考

一、为什么要设定locale 正如前面我所讲的,设定locale与你能否浏览中文的网页没有直接的关系,即便你把locale设置成en_US.ISO-8859-1这样一个标准的 英文locale你照样可以浏览中文的网页,只要你的系统里面有相应的字符集(这个都不一定需要)和合适的字体(如simsun),浏览器就可以把网页翻 译成中文给你看。具体的过程是网络把网页传送到你的机器上之后,浏览器会判断相应的编码的字符集,根据网页采用的字符集,去字体库里面找合适的字体,然后 由文字渲染工具把相应的文字在屏幕上显示出来。

在下偶尔把字符集比喻成字符集,个人觉得对于一些东西比较容易理解,假如你不习惯的话,把全文copy到任何文本编辑器,用字符集替换字符集即可。

那有时候网页显示乱码或者都是方框是怎么回事呢?个人认为,显示乱码是因为设定的字符集不对(或者没有相应的字符集),例如网页是用UTF -8编码的,你非要用GB2312去看,而系统根据GB2312去找字体,然后在屏幕上显示,当然是一堆的乱码,也就是说你用一个错误的字符集去翻译发给 你的电报,当然内容那叫一个乱;至于有些时候浏览的网页能显示一部分汉字,但有很多的地方是方框,能够显示汉字说明浏览器已经正确的判断出了网页的编码, 并在字体库里面找到了相应的文字,但是并不是每个字体库都包含某个字符集全部的字体的缘故,有些时候会显示不完全,找一个比较全的支持较多字符集的字体就 可以了。

既然我能够浏览中文网页,那为什么我还要设定locale呢?

其实你有没有想过这么一个问题,为什么gentoo官方论坛上中文论坛的网页是用UTF-8编码的(虽然大家一直强烈建议用GB2312编 码),但是新浪网就是用GB2312编码的呢?而Xorg的官方网页竟然是ISO-8859-15编码的,我没有设定这个locale怎么一样的能浏览 呢?这个问题就像是你有所有的字符集,不论某个网站是用什么字符集编码的,你都可以用你手里的字符集把他们翻译过来,但问题是虽然你能浏览中文网页,但是 在整个操作系统里面流动的还是英文字符。所以,就像你能听懂英语,也能听懂中文。 最根本的问题是:你不可以写中文。

当你决定要写什么东西的时候,首先要决定的一件事情是用那种语言,对于计算机来说就是你要是用哪一种字符集,你就必须告诉你的 linux系统,你想用那一本字符集去写你想要写的东西。知道为什么需要用GB2312字符集去浏览新浪了吧,因为新浪的网页是用GB2312写的。

为了让你的Linux能够输入中文,就需要把系统的locale设定成中文的(严格说来是locale中的语言类别LC_CTYPE ),例如zh_CN.GB2312、zh_CN.GB18030或者zh_CN.UTF-8。很多人都不明白这些古里古怪的表达方式。这个外星表达式规定 了什么东西呢?这个问题稍后详述,现在只需要知道,这是locale的表达方式就可以了。

二、到底什么是locale? locale这个单词中文翻译成地区或者地域,其实这个单词包含的意义要宽泛很多。Locale是根据计算机用户所使用的语言,所在国家或者地区,以及当地的文化传统所定义的一个软件运行时的语言环境。

这个用户环境可以按照所涉及到的文化传统的各个方面分成几个大类,通常包括用户所使用的语言符号及其分类(LC_CTYPE),数字 (LC_NUMERIC),比较和排序习惯(LC_COLLATE),时间显示格式(LC_TIME),货币单位(LC_MONETARY),信息主要是 提示信息,错误信息, 状态信息, 标题, 标签, 按钮和菜单等(LC_MESSAGES),姓名书写方式(LC_NAME),地址书写方式(LC_ADDRESS),电话号码书写方式 (LC_TELEPHONE),度量衡表达方式(LC_MEASUREMENT),默认纸张尺寸大小(LC_PAPER)和locale对自身包含信息的 概述(LC_IDENTIFICATION)。

所以说,locale就是某一个地域内的人们的语言习惯和文化传统和生活习惯。一个地区的locale就是根据这几大类的习惯定义的, 这些locale定义文件放在/usr/share/i18n/locales目录下面,例如en_US, zh_CN and de_DE@euro都是locale的定义文件,这些文件都是用文本格式书写的,你可以用写字板打开,看看里边的内容,当然出了有限的注释以外,大部分 东西可能你都看不懂,因为是用的Unicode的字符索引方式。

对于de_DE@euro的一点说明,@后边是修正项,也就是说你可以看到两个德国的locale: /usr/share/i18n/locales/de_DE@euro /usr/share/i18n/locales/de_DE 打开这两个locale定义,你就会知道它们的差别在于de_DE@euro使用的是欧洲的排序、比较和缩进习惯,而de_DE用的是德国的标准习惯。

上面我们说到了zh_CN.GB18030的前半部分,后半部分是什么呢?大部分Linux用户都知道是系统采用的字符集。

三、什么是字符集?字符集就是字符,尤其是非英语字符在系统内的编码方式,也就是通常所说的内码,所有的字符集都放在 /usr/share/i18n/charmaps,所有的字符集也都是用Unicode编号索引的。Unicode用统一的编号来索引目前已知的全部的 符号。而字符集则是这些符号的编码方式,或者说是在网络传输,计算机内部通信的时候,对于不同字符的表达方式,Unicode是一个静态的概念,字符集是 一个动态的概念,是每一个字符传递或传输的具体形式。就像 Unicode编号U59D0是代表姐姐的“姐”字,但是具体的这个字是用两个字节表示,三个字节,还是四个字节表示,是字符集的问题。例如:UTF-8 字符集就是目前流行的对字符的编码方式,UTF-8用一个字节表示常用的拉丁字母,用两个字节表示常用的符号,包括常用的中文字符,用三个表示不常用的字 符,用四个字节表示其他的古灵精怪的字符。而GB2312字符集就是用两个字节表示所有的字符。需要提到一点的是Unicode除了用编号索引全部字符以 外,本身是用四个字节存储全部字符,这一点在谈到挂载windows分区的时候是非常重要的一个概念。所以说你也可以把Unicode看作是一种字符集 (我不知道它和UTF-32的关系,反正UTF-32就是用四个字节表示所有的字符的),但是这样表述符号是非常浪费资源的,因为在计算机世界绝大部分时 候用到的是一个字节就可以搞定的 26个字母而已。所以才会有UTF-8,UTF-16等等,要不然大同世界多好,省了这许多麻烦。 四、zh_CN.GB2312到底是在说什么? Locale 是软件在运行时的语言环境, 它包括语言(Language), 地域 (Territory) 和字符集(Codeset)。一个locale的书写格式为: 语言[_地域[.字符集]]. 所以说呢,locale总是和一定的字符集相联系的。下面举几个例子:

1、我说中文,身处中华人民共和国,使用国标2312字符集来表达字符。 zh_CN.GB2312=中文_中华人民共和国+国标2312字符集。

2、我说中文,身处中华人民共和国,使用国标18030字符集来表达字符。 zh_CN.GB18030=中文_中华人民共和国+国标18030字符集。

3、我说中文,身处中华人民共和国台湾省,使用国标Big5字符集来表达字符。 zh_TW.BIG5=中文_台湾.大五码字符集

4、我说英文,身处大不列颠,使用ISO-8859-1字符集来表达字符。 en_GB.ISO-8859-1=英文_大不列颠.ISO-8859-1字符集

5、我说德语,身处德国,使用UTF-8字符集,习惯了欧洲风格。 de_DE.UTF-8@euro=德语_德国.UTF-8字符集@按照欧洲习惯加以修正

注意不是de_DE@euro.UTF-8,所以完全的locale表达方式是 [语言[_地域][.字符集] [@修正值]

生成的locale放在/usr/lib/locale/目录中,并且每个locale都对应一个文件夹,也就是说创建了 de_DE@euro.UTF-8 locale之后,就生成/usr/lib/locale/de_DE@euro.UTF-8/目录,里面是具体的每个locale的内容。

五、怎样去自定义locale 在gentoo生成locale还是很容易的,首先要在USE里面加入userlocales支持,然后编辑locales.build文件,这个文件用 来指示glibc生成locale文件。 很多人不明白每一个条目是什么意思。 其实根据上面的说明现在应该很明确了。

File: /etc/locales.build en_US/ISO-8859-1 en_US.UTF-8/UTF-8

zh_CN/GB18030 zh_CN.GBK/GBK zh_CN.GB2312/GB2312 zh_CN.UTF-8/UTF-8

上面是我的locales.build文件,依次的说明是这样的:

en_US/ISO-8859-1:生成名为en_US的locale,采用ISO-8859-1字符集,并且把这个locale作为英文_美国locale类的默认值,其实它和en_US.ISO-8859-1/ISO-8859-1没有任何区别。

en_US.UTF-8/UTF-8:生成名为en_US.UTF-8的locale,采用UTF-8字符集。

zh_CN/GB18030:生成名为zh_CN的locale,采用GB18030字符集,并且把这个locale作为中文_中国locale类的默认值,其实它和zh_CN.GB18030/GB18030没有任何区别。

zh_CN.GBK/GBK:生成名为zh_CN.GBK的locale,采用GBK字符集。 zh_CN.GB2312/GB2312:生成名为zh_CN.GB2312的locale,采用GB2312字符集。 zh_CN.UTF-8/UTF-8:生成名为zh_CN.UTF-8的locale,采用UTF-8字符集。

关于默认locale,默认locale可以简写成en_US或者zh_CN的形式,只是为了表达简单而已没有特别的意义。

Gentoo在locale定义的时候掩盖了一些东西,也就是locale的生成工具:localedef。在编译完glibc之后你可以 用这个localedef 再补充一些locale,就会更加理解locale了。具体的可以看 localedef 的manpage。

$localedef -f 字符集 -i locale定义文件 生成的locale的名称 例如 $localedef -f UTF-8 -i zh_CN zh_CN.UTF-8

上面的定义方法和在locales.build中设定zh_CN.UTF-8/UTF-8的结果是一样一样的。

六、locale的五脏六腑

刚刚生成了几个locale,但是为了让它们生效,必须告诉Linux系统使用那(几)个locale。这就需要对locale的内部机制 有一点点的了解。在前面我已经提到过,locale把按照所涉及到的文化传统的各个方面分成12个大类,这12个大类分别是: 1、语言符号及其分类(LC_CTYPE) 2、数字(LC_NUMERIC) 3、比较和排序习惯(LC_COLLATE) 4、时间显示格式(LC_TIME) 5、货币单位(LC_MONETARY) 6、信息主要是提示信息,错误信息, 状态信息, 标题, 标签, 按钮和菜单等(LC_MESSAGES) 7、姓名书写方式(LC_NAME) 8、地址书写方式(LC_ADDRESS) 9、电话号码书写方式(LC_TELEPHONE) 10、度量衡表达方式(LC_MEASUREMENT) 11、默认纸张尺寸大小(LC_PAPER) 12、对locale自身包含信息的概述(LC_IDENTIFICATION)。

其中,与中文输入关系最密切的就是 LC_CTYPE, LC_CTYPE 规定了系统内有效的字符以及这些字符的分类,诸如什么是大写字母,小写字母,大小写转换,标点符号、可打印字符和其他的字符属性等方面。而locale定 义zh_CN中最最重要的一项就是定义了汉字(Class “hanzi”)这一个大类,当然也是用Unicode描述的,这就让中文字符在Linux系统中成为合法的有效字符,而且不论它们是用什么字符集编码 的。

LC_CTYPE % This is a copy of the "i18n" LC_CTYPE with the following modifications: - Additional classes: hanzi

copy "i18n"

class "hanzi"; / % ..;/ ..;/ ;;;;;;;;/ ;;;;;;;;/ ;;;; END LC_CTYPE

在en_US的locale定义中,并没有定义汉字,所以汉字不是有效字符。所以如果要输入中文必须使用支持中文的locale,也就是zh_XX,如zh_CN,zh_TW,zh_HK等等。

另外非常重要的一点就是这些分类是彼此独立的,也就是说LC_CTYPE,LC_COLLATE和 LC_MESSAGES等等分类彼此之间是独立的,可以根据用户的需要设定成不同的值。这一点对很多用户是有利的,甚至是必须的。例如,我就需要一个能够 输入中文的英文环境,所以我可以把LC_CTYPE设定成zh_CN.GB18030,而其他所有的项都是en_US.UTF-8。

七、怎样设定locale呢?

设定locale就是设定12大类的locale分类属性,即 12个LC_*。除了这12个变量可以设定以外,为了简便起见,还有两个变量:LC_ALL和LANG。它们之间有一个优先级的关系: LC_ALL>LC_*>LANG 可以这么说,LC_ALL是最上级设定或者强制设定,而LANG是默认设定值。 1、如果你设定了LC_ALL=zh_CN.UTF-8,那么不管LC_*和LANG设定成什么值,它们都会被强制服从LC_ALL的设定,成为 zh_CN.UTF-8。 2、假如你设定了LANG=zh_CN.UTF-8,而其他的LC_*=en_US.UTF-8,并且没有设定LC_ALL的话,那么系统的locale 设定以LC_*=en_US.UTF-8。 3、假如你设定了LANG=zh_CN.UTF-8,而其他的LC_*,和LC_ALL均未设定的话,系统会将LC_*设定成默认值,也就是LANG的值 zh_CN.UTF-8 。 4、假如你设定了LANG=zh_CN.UTF-8,而其他的LC_CTYPE=en_US.UTF-8,其他的LC_*,和LC_ALL均未设定的话, 那么系统的locale设定将是:LC_CTYPE=en_US.UTF-8,其余的 LC_COLLATE,LC_MESSAGES等等均会采用默认值,也就是LANG的值,也就是LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=zh_CN.UTF-8。

所以,locale是这样设定的: 1、如果你需要一个纯中文的系统的话,设定LC_ALL= zh_CN.XXXX,或者LANG= zh_CN.XXXX都可以,当然你可以两个都设定,但正如上面所讲,LC_ALL的值将覆盖所有其他的locale设定,不要作无用功。 2、如果你只想要一个可以输入中文的环境,而保持菜单、标题,系统信息等等为英文界面,那么只需要设定LC_CTYPE=zh_CN.XXXX,LANG = en_US.XXXX就可以了。这样LC_CTYPE=zh_CN.XXXX,而LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=en_US.XXXX。 3、假如你高兴的话,可以把12个LC_*一一设定成你需要的值,打造一个古灵精怪的系统: LC_CTYPE=zh_CN.GBK/GBK(使用中文编码内码GBK字符集); LC_NUMERIC=en_GB.ISO-8859-1(使用大不列颠的数字系统) LC_MEASUREMEN=de_DE@euro.ISO-8859-15(德国的度量衡使用ISO-8859-15字符集) 罗马的地址书写方式,美国的纸张设定……。估计没人这么干吧。 4、假如你什么也不做的话,也就是LC_ALL,LANG和LC_*均不指定特定值的话,系统将采用POSIX作为lcoale,也就是C locale。 XMODIFIERS=@im=fcitx

the config files of Xfce(user level)

The config files of Xfce are in the "~/.config", but some cache config are in "~/.cache".
to reset the config, must delete both of these file.

急に、日本語1級を出願を考えている。

また、自分の規則を守らない。でも、急に、日本語1級を出願を考えている。試すことをきまりました。できれば、一級を出願。。。

2008年6月15日星期日

今日、毛さんとデートしました。はは。。

でーたしましたが、6百円をかかりました。でも、嬉しかった。たいした事がなかったけれど、お金がかかったので、心が痛かった。
また、また、自我を浪費した。
どうしたら、僕を救えるか?無駄だなあ。。。。
信じられない、僕もこんなにじかんを。。。。。

できないか。自分を疑うか? だめだ、こんなに続ければだめだ。ゲームを削除しましょう。。。
決まりました。ああああああああああああああああああああああ、また時間になるね。寝る。

2008年6月14日星期六

今日、僕また、時間を浪費しました。

まず、今日、長い時間を浪費しました。これから、必ずゲームをしないで、休みを保つために時間を利用する。
つぎ、理髪しました。さわやかな感じがあって、明日は、毛さんに会いましょう。

また、ウィンドウズの下に、日本語を入力することができるが、Linuxの下に日本語を入力することができないから、日本語を入力力にはウィンドウズで入力しなければならない。

今すぐ12時になりますから、寝るよ。

OK, i gone back on my words

Today, I slept at 0:24, I didn't keep my words. I will not do this again..

2008年6月12日星期四

坚持自己的决定

今天过得可真快呀,我本来想坚持自己的决定,每天翻译一点东西。但是时间不等人呀,所以,我又修改了一下自己的决定。还是以要事为先。。

2008年6月11日星期三

我又有了新的决定了

哈哈,好的兆头,我又有了新的决定了。。。
-----OK,就让这里记录我成功的一切吧。 好,现在公布我的决定:现在开始我就用日语或英语写这个博客。。。。只要坚持一定会成功的。

现在重新开一个帖子记下一个自己的所有决定,o(∩_∩)o...哈哈。。。。。。成功就在眼前了,,,,只要坚持

2008年6月10日星期二

我变得越来越不爱学习了,

时间被我浪费了很多了,这两天总是看电影,都是由于网络的原因,每天都在回来后看电影,昨天和今天都看了最终幻想,很早都想看的。
但是这样下去的话。我会变形成什么样呢,变成什么样呢,不知道,还是不愿意去想呢。难到我真的就这么没有自制力吗,看着电影的确是很好看,但是看完了之后呢,我会得到一些什么呢,就为了当时的爽吗,最终我决定,每周可以看两部电影,每天只看一集动画片,每天晚上11点之前睡觉。。坚决执行。。。。。

2008年6月9日星期一

平平常常的一天

要想每天都写点什么的话,也不是很容易呀,对我来说,写点什么呢。又是平平常常的一天。
对了,今天很是困呀,今天还是早点睡吧,哈哈,,,

2008年6月8日星期日

第一篇文章,送给我自己。

来日本有两个月了,感觉时间过得很快,有很多事情没有做就已经过去了很多的时间。
我这跟人的记性不好,为了能不把我的日本生活忘记了,我决定开始写博客。 虽然是第一次,但是我觉得挺有意思,加油, 为我自己。。。。。
或许,十几年或者几十年后自己看到自己的博客会感动的流下泪来。。o(∩_∩)o...哈哈。。。
时间不早了,赶快睡觉。。。