2008年6月23日星期一
2008年6月22日星期日
acc格式文件的说明,手机用的
2008年6月21日星期六
新しい部屋を探しました。
ああああああああああ。本当に難しい、でもしょうがないとは、しょうがない、頑張ってね。
インストール startdict
1。USE="gnome" emerge -av stardict
2。サイト「http://stardict.sourceforge.net/cn/Dictionaries_ja.php」に行って、辞書ファイルをダウンロードする。
3。tar jxvf stardict-jmdict-ja-en-2.4.2.tar.bz2
4。mv stardict-jmdict-en-ja-2.4.2 /usr/share/stardict/dic/
5。「stardict」を実行する。
the process of emerging gimp
but, after adding "jpeg jpeg2k " to /etc/make.conf, it became normal. so great.
2008年6月20日星期五
2008年6月19日星期四
今日の嬉しいことがあるよ
ね、時間がないで、必ず早く引越して行く。
2008年6月18日星期三
ExcelのVBAを勉強しました。
god. my god, 元々、時間がないのに、ただいま、またqqの上で刘恩夫にあいました、彼に履歴書を修正させられた。しょうがないなああああ.。。
ええ。また、ウィンドウズに入らなければならない。
心理学教授谈记忆魔法--艾宾浩斯遗忘曲线
作者:乐国安
人的大脑是一个记忆的宝库,人脑经历过的事物,思考过的问题,体验过的情感和情绪,练习过的动作,都可以成为人们记忆的内容。例如英文的学习中单词、短语和句子,甚至文章的内容都是通过记忆完成的。从"记"到"忆"是有个过程的,这其中包括了识记、保持、再认和回忆。有很多
人在学习英语的过程中,只注重了学习当时的记忆效果,孰不知,要想做好学习的记忆工作,是要下一番工夫的,单纯的注重当时的记忆效果,而忽视了后期的保持和再认同样是达不到良好的效果的。
在信息的处理上,记忆是对输入信息的编码、贮存和提取的过程,从信息处理的角度上,英文的第一次学习和背诵只是一个输入编码的过程。人的记忆的能力从生理上讲是十分惊人的,它可以存贮1015比特(byte,字节)的信息,可是每个人的记忆宝库被挖掘的只占10%,还有更多的记忆发挥空间。这是因为,有些人只关注了记忆的当时效果,却忽视了记忆中的更大的问题--即记忆的牢固度问题,那就牵涉到心理学中常说的关于记忆遗忘的规律。
一、艾宾浩斯记忆规律曲线解释
德国有一位著名的心理学家名叫艾宾浩斯(Hermann Ebbinghaus,1850-1909),他在1885年发表了他的实验报告后,记忆研究就成了心理学中被研究最多的领域之一,而艾宾浩斯正是发现记忆遗忘规律的第一人。
根据我们所知道的,记忆的保持在时间上是不同的,有短时的记忆和长时的记忆两种。而我们平时的记忆的过程是这样的:
输入的信息在经过人的注意过程的学习后,便成为了人的短时的记忆,但是如果不经过及时的复习,这些记住过的东西就会遗忘,而经过了及时的复习,这些短时的记忆就会成为了人的一种长时的记忆,从而在大脑中保持着很长的时间。那么,对于我们来讲,怎样才叫做遗忘呢,所谓遗忘就是我们对于曾经记忆过的东西不能再认起来,也不能回忆起来,或者是错误的再认和错误的回忆,这些都是遗忘。艾宾浩斯在做这个实验的时候是拿自己作为测试对象的,他得出了一些关于记忆的结论。他选用了一些根本没有意义的音节,也就是那些不能拼出单词来的众多字母的组合,比如asww,cfhhj,ijikmb,rfyjbc等等。他经过对自己的测试,得到了一些数据。
这条曲线告诉人们在学习中的遗忘是有规律的,遗忘的进程不是均衡的,不是固定的一天丢掉几个,转天又丢几个的,而是在记忆的最初阶段遗忘的速度很快,后来就逐渐减慢了,到了相当长的时候后,几乎就不再遗忘了,这就是遗忘的发展规律,即"先快后慢"的原则。观察这条遗忘曲线,你会发现,学得的知识在一天后,如不抓紧复习,就只剩下原来的25%)。随着时间的推移,遗忘的速度减慢,遗忘的数量也就减少。有人做过一个实验,两组学生学习一段课文,甲组在学习后不久进行一次复习,乙组不予复习,一天后甲组保持98%,乙组保持56%;一周后甲组保持83%,乙组保持33%。乙组的遗忘平均值比甲组高。
二、不同性质材料有不同的遗忘曲线
而且,艾宾浩斯还在关于记忆的实验中发现,记住12个无意义音节,平均需要重复16.5次;为了记住36个无意义章节,需重复54次;而记忆六首诗中的480个音节,平均只需要重复8次!这个实验告诉我们,凡是理解了的知识,就能记得迅速、全面而牢固。不然,愣是死记硬背,那也是费力不讨好的。因此,比较容易记忆的是那些有意义的材料,而那些无意义的材料在记忆的时候比较费力气,在以后回忆起来的时候也很不轻松。因此,艾宾浩斯遗忘曲线是关于遗忘的一种曲线,而且是对无意义的音节而言,对于与其他材料的对比,艾宾浩斯又得出了不同性质材料的不同遗忘曲线,不过他们大体上都是一致的。
因此,艾宾浩斯的实验向我们充分证实了一个道理,学习要勤于复习,而且记忆的理解效果越好,遗忘的也越慢。
三、不同的人有不同的艾宾浩斯记忆曲线--个性化的艾宾浩斯
上述的艾宾浩斯记忆曲线是艾宾浩斯在实验室中经过了大量测试后,产生了不同的记忆数据,从而生成的一种曲线,是一个具有共性的群体规律。此记忆曲线并不考虑接受试验个人的个性特点,而是寻求一种处于平衡点的记忆规律。
但是记忆规律可以具体到我们每个人,因为我们的生理特点、生活经历不同,可能导致我们有不同的记忆习惯、记忆方式、记忆特点。规律对于自然人改造世界的行为,只能起一个催化的作用,如果与每个人的记忆特点相吻合,那么就如顺水扬帆,一日千里;如果与个人记忆特点相悖,记忆效果则会大打折扣。因此,我们要根据每个人的不同特点,寻找到属于自己的艾宾浩斯记忆曲线。(作者系南开大学心理学教授 博士生导师)
2008年6月17日星期二
今日、チャットしました、、一級のことは堅持できるかどうかわからない
こころがいたいにしても、しようがない。しょうがないか?・・
泣くほど、いらいらする。。。。。。
让Adobe acroread显示pdf文件中的中文简体、繁体及日、韩字体的方法
很简单,在安装Adobe的Acrobat Reader之后,再安装相应的字库就可。
中日韩的字库可以到Adobe的网站下载,网址是:
http://www.adobe.com/products/acrobat/acrrasianfontpack.html
或者直接到Adobe ftp下载,地址是:
ftp://ftp.adobe.com/pub/adobe/acrobatreader/unix/5.x
字库文件名是:
中文简体:chsfont.tar.gz
中文繁体:chtfont.tar.gz
日文:jpnfont.tar.gz
韩文:korfont.tar.gz
下载后,解压,然后分别运行./INSTALL文件,再按照屏幕提示安装。
提示输入安装目录的时候,默认的[/opt]就可以,gentoo默认安装目录就是这个。
安装后,重新运行acroread及可。
2008年6月16日星期一
HOWTO 本地化完美解决方案
在AMD64 Sempron(tm) Processor 3000+上进行的测试,目标是英文或中文界面,北京时间,附带中日韩输入法
字体的安装
如果可以的话,下载msyh.ttf并将其copy到/usr/share/fonts/msyh/下,权限644,再在/etc/X11/xorg.conf中 Section "Files" 段添加 FontPath "/usr/share/fonts/msyh" 然后执行fc-cache -f -v ,字体添加完毕
LINGUAS的具体用途
在/etc/make.conf中可以设置LINGUAS,如果设置成LINGUAS="zh_CN" ,那么在firefox,openoffice,kde-i18n...中生成带有中文的空间。
测试:我在编译openoffice时加入了这一选项,结果出来openoffice是中文的(我系统中所有applications均是英文的)。
设置locale
File:/etc/locale.gen
en_US.UTF-8 UTF-8
zh_CN.UTF-8 UTF-8
ja_JP.UTF-8 UTF-8
zh_CN.GBK GBK
要用中文日文输入法zh_CN.UTF-8 UTF-8和ja_JP.UTF-8 UTF-8是少不了的。韩文的ko_KR.UTF-8 UTF-8是少不了的。然后运行locale-gen
测试:我曾在上面的/etc/locale.gen中没有设ja_JP.UTF-8 UTF-8,结果只有中文输入法能用。
还有所有的UTF-8,GBK,GB2312最后都会自动转换成utf8,gbk,gb2312不信你执行locale -a试一下就都明白了。
Why zh_CN.GBK GBK?
加入这一项就是为了能够阅读从Windows那里过来的中文文档。怎么读? Linuxsir gentoo
没有加入gb2312原因是gbk是gb2312的超集,所以gbk就够了。至于gb18030我以前加过,但是从来没有用到过,如果有需要可以视情况而定。
加入/etc/env.d/02locale
File:/etc/env.d/02locale
LANG="en_US.UTF-8"
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
执行source /etc/env.d/02locale
测试:唯独LC_CTYPE设置成zh_CN.UTF-8,原因是这样设置才会有中文输入法,同时日文输入法也会有,我想韩文大抵也如此。我曾经试过设置成en_US.UTF-8,结果中日输入法均无法使用。
附注:其实在LC_CTYPE=zh_CN.UTF-8 下也可以启动输入发 scim就不用说了 fcitx的启动方法是 env LC_CTYPE=zh_CN.UTF-8 fcitx 就行了 这样就可以不用影响其它程序了 在某些程序中(firefox等)不能切换出输入法的时候可以修改 etc\gtk-2.0\gtk.immodules 文件 将中间的
"/usr/lib/gtk-2.0/2.10.0/immodules/im-xim.so"
"xim" "X Input Method" "gtk20" "/usr/share/locale" "ko:ja:th:zh"
加上 en 就可
"/usr/lib/gtk-2.0/2.10.0/immodules/im-xim.so"
"xim" "X Input Method" "gtk20" "/usr/share/locale" "en:ko:ja:th:zh"
安装输入法
emerge scim scim-pinyin scim-anthy(韩文是scim-hangul.切记要最后emerge)
完成之后在~/.xinitrc和~/.xsession中加入
export XMODIFIERS=@im=SCIM
/*****************特别注意这个地方,我用的fcitx,因为这里搞成了XMODIFIERS="@im=fcitx",导致无法输入中文。具体现象是输入法面板能出来,也能接受鼠标点击,比如半/全角切换、拼音/五笔切换等等,但Ctrl+空格无法切换成蓝色,输入方式那始终灰的。今天才发现这个错误。
另外,我处理环境变量的方式是编辑一个新文件/etc/env.d/99myownstuff,所有全局的环境变量集中到这里设置。内容如下:
jiejie@ysj ~ $ cat /etc/env.d/99myownstuff
#定义LANG和LC_CTYPE,这里我用英文环境,中文输入,编码utf8
LANG=en_US.UTF-8
'LC_CTYPE=zh_CN.UTF-8
#定义fcitx中文输入所需变量
XMODIFIERS='@im=fcitx'
XIM=fcitx
XIM_PROGRAM=fcitx
by ziyouwaYJ 2008-05-30***************/
export GTK_IM_MODULE="scim"
export QT_IM_MODULE="scim"
scim -d
#exec /usr/bin/ssh-agent -- /usr/bin/gnome-session
exec /usr/bin/ssh-agent -- /usr/kde/3.5/bin/startkde
如果你用gnome,就相应的修改一下。.xinitrc是startx时用的,gdm/kdm里的custom session则会调用~/.xsession
配置/etc/conf.d/clock和/etc/rc.conf
File:/etc/conf.d/clock中更改两个参数
CLOCK="local"
TIMEZONE="Asia/Shanghai"
File:/etc/rc.conf中更改两个参数
EDITOR="/usr/bin/vim"
XSESSION="Gnome"
其他参数不要改动
本地时间的设置
系统的时间配置在/etc/conf.d/clock 更改两个设置
CLOCK="local"
TIMEZONE="Asia/Shanghai"
其他的参数不变
方法二
上面的方法会使tty下中文产生乱码,经过讨论,这里提供另一方法。此法好处是不会使一些软件的中文无法显示,同时保持系统的locale的不变。 这种方式只有vim无法显示和输入中文,emacs无法输入中文,其他的都可以。(若你想在vim和emacs下输入中日韩。Command: echo "LC_ALL="en_US.UTF-8"" >/etc/env.d/02locale )我也推荐这种方法。
设置locale
File:/etc/locale.gen
en_US.UTF-8 UTF-8
zh_CN.UTF-8 UTF-8
ja_JP.UTF-8 UTF-8
ko_KR.UTF-8 UTF-8
zh_CN.GBK GBK
运行locale-gen
安装输入法
emerge scim scim-pinyin scim-anthy scim-hangul
在~/.bashrc中添加两行:
export XMODIFIERS=@im=SCIM
export GTK_IM_MODULE="scim"(gnome)
export QT_IM_MODULE="scim"(kde)
重启,一切OK!
locale设定 原因 解释
ps:这是我曾经收录的一篇文章,出处已无从查找,仅作为本篇本地化文章的参考
一、为什么要设定locale 正如前面我所讲的,设定locale与你能否浏览中文的网页没有直接的关系,即便你把locale设置成en_US.ISO-8859-1这样一个标准的 英文locale你照样可以浏览中文的网页,只要你的系统里面有相应的字符集(这个都不一定需要)和合适的字体(如simsun),浏览器就可以把网页翻 译成中文给你看。具体的过程是网络把网页传送到你的机器上之后,浏览器会判断相应的编码的字符集,根据网页采用的字符集,去字体库里面找合适的字体,然后 由文字渲染工具把相应的文字在屏幕上显示出来。
在下偶尔把字符集比喻成字符集,个人觉得对于一些东西比较容易理解,假如你不习惯的话,把全文copy到任何文本编辑器,用字符集替换字符集即可。
那有时候网页显示乱码或者都是方框是怎么回事呢?个人认为,显示乱码是因为设定的字符集不对(或者没有相应的字符集),例如网页是用UTF -8编码的,你非要用GB2312去看,而系统根据GB2312去找字体,然后在屏幕上显示,当然是一堆的乱码,也就是说你用一个错误的字符集去翻译发给 你的电报,当然内容那叫一个乱;至于有些时候浏览的网页能显示一部分汉字,但有很多的地方是方框,能够显示汉字说明浏览器已经正确的判断出了网页的编码, 并在字体库里面找到了相应的文字,但是并不是每个字体库都包含某个字符集全部的字体的缘故,有些时候会显示不完全,找一个比较全的支持较多字符集的字体就 可以了。
既然我能够浏览中文网页,那为什么我还要设定locale呢?
其实你有没有想过这么一个问题,为什么gentoo官方论坛上中文论坛的网页是用UTF-8编码的(虽然大家一直强烈建议用GB2312编 码),但是新浪网就是用GB2312编码的呢?而Xorg的官方网页竟然是ISO-8859-15编码的,我没有设定这个locale怎么一样的能浏览 呢?这个问题就像是你有所有的字符集,不论某个网站是用什么字符集编码的,你都可以用你手里的字符集把他们翻译过来,但问题是虽然你能浏览中文网页,但是 在整个操作系统里面流动的还是英文字符。所以,就像你能听懂英语,也能听懂中文。 最根本的问题是:你不可以写中文。
当你决定要写什么东西的时候,首先要决定的一件事情是用那种语言,对于计算机来说就是你要是用哪一种字符集,你就必须告诉你的 linux系统,你想用那一本字符集去写你想要写的东西。知道为什么需要用GB2312字符集去浏览新浪了吧,因为新浪的网页是用GB2312写的。
为了让你的Linux能够输入中文,就需要把系统的locale设定成中文的(严格说来是locale中的语言类别LC_CTYPE ),例如zh_CN.GB2312、zh_CN.GB18030或者zh_CN.UTF-8。很多人都不明白这些古里古怪的表达方式。这个外星表达式规定 了什么东西呢?这个问题稍后详述,现在只需要知道,这是locale的表达方式就可以了。
二、到底什么是locale? locale这个单词中文翻译成地区或者地域,其实这个单词包含的意义要宽泛很多。Locale是根据计算机用户所使用的语言,所在国家或者地区,以及当地的文化传统所定义的一个软件运行时的语言环境。
这个用户环境可以按照所涉及到的文化传统的各个方面分成几个大类,通常包括用户所使用的语言符号及其分类(LC_CTYPE),数字 (LC_NUMERIC),比较和排序习惯(LC_COLLATE),时间显示格式(LC_TIME),货币单位(LC_MONETARY),信息主要是 提示信息,错误信息, 状态信息, 标题, 标签, 按钮和菜单等(LC_MESSAGES),姓名书写方式(LC_NAME),地址书写方式(LC_ADDRESS),电话号码书写方式 (LC_TELEPHONE),度量衡表达方式(LC_MEASUREMENT),默认纸张尺寸大小(LC_PAPER)和locale对自身包含信息的 概述(LC_IDENTIFICATION)。
所以说,locale就是某一个地域内的人们的语言习惯和文化传统和生活习惯。一个地区的locale就是根据这几大类的习惯定义的, 这些locale定义文件放在/usr/share/i18n/locales目录下面,例如en_US, zh_CN and de_DE@euro都是locale的定义文件,这些文件都是用文本格式书写的,你可以用写字板打开,看看里边的内容,当然出了有限的注释以外,大部分 东西可能你都看不懂,因为是用的Unicode的字符索引方式。
对于de_DE@euro的一点说明,@后边是修正项,也就是说你可以看到两个德国的locale: /usr/share/i18n/locales/de_DE@euro /usr/share/i18n/locales/de_DE 打开这两个locale定义,你就会知道它们的差别在于de_DE@euro使用的是欧洲的排序、比较和缩进习惯,而de_DE用的是德国的标准习惯。
上面我们说到了zh_CN.GB18030的前半部分,后半部分是什么呢?大部分Linux用户都知道是系统采用的字符集。
三、什么是字符集?字符集就是字符,尤其是非英语字符在系统内的编码方式,也就是通常所说的内码,所有的字符集都放在 /usr/share/i18n/charmaps,所有的字符集也都是用Unicode编号索引的。Unicode用统一的编号来索引目前已知的全部的 符号。而字符集则是这些符号的编码方式,或者说是在网络传输,计算机内部通信的时候,对于不同字符的表达方式,Unicode是一个静态的概念,字符集是 一个动态的概念,是每一个字符传递或传输的具体形式。就像 Unicode编号U59D0是代表姐姐的“姐”字,但是具体的这个字是用两个字节表示,三个字节,还是四个字节表示,是字符集的问题。例如:UTF-8 字符集就是目前流行的对字符的编码方式,UTF-8用一个字节表示常用的拉丁字母,用两个字节表示常用的符号,包括常用的中文字符,用三个表示不常用的字 符,用四个字节表示其他的古灵精怪的字符。而GB2312字符集就是用两个字节表示所有的字符。需要提到一点的是Unicode除了用编号索引全部字符以 外,本身是用四个字节存储全部字符,这一点在谈到挂载windows分区的时候是非常重要的一个概念。所以说你也可以把Unicode看作是一种字符集 (我不知道它和UTF-32的关系,反正UTF-32就是用四个字节表示所有的字符的),但是这样表述符号是非常浪费资源的,因为在计算机世界绝大部分时 候用到的是一个字节就可以搞定的 26个字母而已。所以才会有UTF-8,UTF-16等等,要不然大同世界多好,省了这许多麻烦。 四、zh_CN.GB2312到底是在说什么? Locale 是软件在运行时的语言环境, 它包括语言(Language), 地域 (Territory) 和字符集(Codeset)。一个locale的书写格式为: 语言[_地域[.字符集]]. 所以说呢,locale总是和一定的字符集相联系的。下面举几个例子:
1、我说中文,身处中华人民共和国,使用国标2312字符集来表达字符。 zh_CN.GB2312=中文_中华人民共和国+国标2312字符集。
2、我说中文,身处中华人民共和国,使用国标18030字符集来表达字符。 zh_CN.GB18030=中文_中华人民共和国+国标18030字符集。
3、我说中文,身处中华人民共和国台湾省,使用国标Big5字符集来表达字符。 zh_TW.BIG5=中文_台湾.大五码字符集
4、我说英文,身处大不列颠,使用ISO-8859-1字符集来表达字符。 en_GB.ISO-8859-1=英文_大不列颠.ISO-8859-1字符集
5、我说德语,身处德国,使用UTF-8字符集,习惯了欧洲风格。 de_DE.UTF-8@euro=德语_德国.UTF-8字符集@按照欧洲习惯加以修正
注意不是de_DE@euro.UTF-8,所以完全的locale表达方式是 [语言[_地域][.字符集] [@修正值]
生成的locale放在/usr/lib/locale/目录中,并且每个locale都对应一个文件夹,也就是说创建了 de_DE@euro.UTF-8 locale之后,就生成/usr/lib/locale/de_DE@euro.UTF-8/目录,里面是具体的每个locale的内容。
五、怎样去自定义locale 在gentoo生成locale还是很容易的,首先要在USE里面加入userlocales支持,然后编辑locales.build文件,这个文件用 来指示glibc生成locale文件。 很多人不明白每一个条目是什么意思。 其实根据上面的说明现在应该很明确了。
File: /etc/locales.build en_US/ISO-8859-1 en_US.UTF-8/UTF-8
zh_CN/GB18030 zh_CN.GBK/GBK zh_CN.GB2312/GB2312 zh_CN.UTF-8/UTF-8
上面是我的locales.build文件,依次的说明是这样的:
en_US/ISO-8859-1:生成名为en_US的locale,采用ISO-8859-1字符集,并且把这个locale作为英文_美国locale类的默认值,其实它和en_US.ISO-8859-1/ISO-8859-1没有任何区别。
en_US.UTF-8/UTF-8:生成名为en_US.UTF-8的locale,采用UTF-8字符集。
zh_CN/GB18030:生成名为zh_CN的locale,采用GB18030字符集,并且把这个locale作为中文_中国locale类的默认值,其实它和zh_CN.GB18030/GB18030没有任何区别。
zh_CN.GBK/GBK:生成名为zh_CN.GBK的locale,采用GBK字符集。 zh_CN.GB2312/GB2312:生成名为zh_CN.GB2312的locale,采用GB2312字符集。 zh_CN.UTF-8/UTF-8:生成名为zh_CN.UTF-8的locale,采用UTF-8字符集。
关于默认locale,默认locale可以简写成en_US或者zh_CN的形式,只是为了表达简单而已没有特别的意义。
Gentoo在locale定义的时候掩盖了一些东西,也就是locale的生成工具:localedef。在编译完glibc之后你可以 用这个localedef 再补充一些locale,就会更加理解locale了。具体的可以看 localedef 的manpage。
$localedef -f 字符集 -i locale定义文件 生成的locale的名称 例如 $localedef -f UTF-8 -i zh_CN zh_CN.UTF-8
上面的定义方法和在locales.build中设定zh_CN.UTF-8/UTF-8的结果是一样一样的。
六、locale的五脏六腑
刚刚生成了几个locale,但是为了让它们生效,必须告诉Linux系统使用那(几)个locale。这就需要对locale的内部机制 有一点点的了解。在前面我已经提到过,locale把按照所涉及到的文化传统的各个方面分成12个大类,这12个大类分别是: 1、语言符号及其分类(LC_CTYPE) 2、数字(LC_NUMERIC) 3、比较和排序习惯(LC_COLLATE) 4、时间显示格式(LC_TIME) 5、货币单位(LC_MONETARY) 6、信息主要是提示信息,错误信息, 状态信息, 标题, 标签, 按钮和菜单等(LC_MESSAGES) 7、姓名书写方式(LC_NAME) 8、地址书写方式(LC_ADDRESS) 9、电话号码书写方式(LC_TELEPHONE) 10、度量衡表达方式(LC_MEASUREMENT) 11、默认纸张尺寸大小(LC_PAPER) 12、对locale自身包含信息的概述(LC_IDENTIFICATION)。
其中,与中文输入关系最密切的就是 LC_CTYPE, LC_CTYPE 规定了系统内有效的字符以及这些字符的分类,诸如什么是大写字母,小写字母,大小写转换,标点符号、可打印字符和其他的字符属性等方面。而locale定 义zh_CN中最最重要的一项就是定义了汉字(Class “hanzi”)这一个大类,当然也是用Unicode描述的,这就让中文字符在Linux系统中成为合法的有效字符,而且不论它们是用什么字符集编码 的。
LC_CTYPE % This is a copy of the "i18n" LC_CTYPE with the following modifications: - Additional classes: hanzi
copy "i18n"
class "hanzi"; / % ..;/ ..;/ ;;;;;;;;/ ;;;;;;;;/ ;;;; END LC_CTYPE
在en_US的locale定义中,并没有定义汉字,所以汉字不是有效字符。所以如果要输入中文必须使用支持中文的locale,也就是zh_XX,如zh_CN,zh_TW,zh_HK等等。
另外非常重要的一点就是这些分类是彼此独立的,也就是说LC_CTYPE,LC_COLLATE和 LC_MESSAGES等等分类彼此之间是独立的,可以根据用户的需要设定成不同的值。这一点对很多用户是有利的,甚至是必须的。例如,我就需要一个能够 输入中文的英文环境,所以我可以把LC_CTYPE设定成zh_CN.GB18030,而其他所有的项都是en_US.UTF-8。
七、怎样设定locale呢?
设定locale就是设定12大类的locale分类属性,即 12个LC_*。除了这12个变量可以设定以外,为了简便起见,还有两个变量:LC_ALL和LANG。它们之间有一个优先级的关系: LC_ALL>LC_*>LANG 可以这么说,LC_ALL是最上级设定或者强制设定,而LANG是默认设定值。 1、如果你设定了LC_ALL=zh_CN.UTF-8,那么不管LC_*和LANG设定成什么值,它们都会被强制服从LC_ALL的设定,成为 zh_CN.UTF-8。 2、假如你设定了LANG=zh_CN.UTF-8,而其他的LC_*=en_US.UTF-8,并且没有设定LC_ALL的话,那么系统的locale 设定以LC_*=en_US.UTF-8。 3、假如你设定了LANG=zh_CN.UTF-8,而其他的LC_*,和LC_ALL均未设定的话,系统会将LC_*设定成默认值,也就是LANG的值 zh_CN.UTF-8 。 4、假如你设定了LANG=zh_CN.UTF-8,而其他的LC_CTYPE=en_US.UTF-8,其他的LC_*,和LC_ALL均未设定的话, 那么系统的locale设定将是:LC_CTYPE=en_US.UTF-8,其余的 LC_COLLATE,LC_MESSAGES等等均会采用默认值,也就是LANG的值,也就是LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=zh_CN.UTF-8。
所以,locale是这样设定的: 1、如果你需要一个纯中文的系统的话,设定LC_ALL= zh_CN.XXXX,或者LANG= zh_CN.XXXX都可以,当然你可以两个都设定,但正如上面所讲,LC_ALL的值将覆盖所有其他的locale设定,不要作无用功。 2、如果你只想要一个可以输入中文的环境,而保持菜单、标题,系统信息等等为英文界面,那么只需要设定LC_CTYPE=zh_CN.XXXX,LANG = en_US.XXXX就可以了。这样LC_CTYPE=zh_CN.XXXX,而LC_COLLATE=LC_MESSAGES=……= LC_PAPER=LANG=en_US.XXXX。 3、假如你高兴的话,可以把12个LC_*一一设定成你需要的值,打造一个古灵精怪的系统: LC_CTYPE=zh_CN.GBK/GBK(使用中文编码内码GBK字符集); LC_NUMERIC=en_GB.ISO-8859-1(使用大不列颠的数字系统) LC_MEASUREMEN=de_DE@euro.ISO-8859-15(德国的度量衡使用ISO-8859-15字符集) 罗马的地址书写方式,美国的纸张设定……。估计没人这么干吧。 4、假如你什么也不做的话,也就是LC_ALL,LANG和LC_*均不指定特定值的话,系统将采用POSIX作为lcoale,也就是C locale。 XMODIFIERS=@im=fcitx
the config files of Xfce(user level)
to reset the config, must delete both of these file.
2008年6月15日星期日
今日、毛さんとデートしました。はは。。
また、また、自我を浪費した。
どうしたら、僕を救えるか?無駄だなあ。。。。
信じられない、僕もこんなにじかんを。。。。。
できないか。自分を疑うか? だめだ、こんなに続ければだめだ。ゲームを削除しましょう。。。
決まりました。ああああああああああああああああああああああ、また時間になるね。寝る。
2008年6月14日星期六
今日、僕また、時間を浪費しました。
つぎ、理髪しました。さわやかな感じがあって、明日は、毛さんに会いましょう。
また、ウィンドウズの下に、日本語を入力することができるが、Linuxの下に日本語を入力することができないから、日本語を入力力にはウィンドウズで入力しなければならない。
今すぐ12時になりますから、寝るよ。
OK, i gone back on my words
2008年6月12日星期四
2008年6月11日星期三
2008年6月10日星期二
我变得越来越不爱学习了,
但是这样下去的话。我会变形成什么样呢,变成什么样呢,不知道,还是不愿意去想呢。难到我真的就这么没有自制力吗,看着电影的确是很好看,但是看完了之后呢,我会得到一些什么呢,就为了当时的爽吗,最终我决定,每周可以看两部电影,每天只看一集动画片,每天晚上11点之前睡觉。。坚决执行。。。。。
2008年6月9日星期一
2008年6月8日星期日
第一篇文章,送给我自己。
我这跟人的记性不好,为了能不把我的日本生活忘记了,我决定开始写博客。 虽然是第一次,但是我觉得挺有意思,加油, 为我自己。。。。。
或许,十几年或者几十年后自己看到自己的博客会感动的流下泪来。。o(∩_∩)o...哈哈。。。
时间不早了,赶快睡觉。。。