« April 2004 | Main | June 2004 »

May 25, 2004

Cold Mountain


xigua
16:09 PM


刚看了《Cold Mountain》,不错的片子,没有想到那时候的美国人这么淳朴。

特别喜欢她的音乐,因为本来就蛮喜欢美国乡村音乐的,是大一还是大二的时候,曾经疯狂地寻找美国乡村音乐中一种非常特别的乐器的音乐。想要找这种乐器的声音是因为我小时候很喜欢《大狗副警长》里边的一只金花鼠弹那种乐器,很“发燕”。这种乐器的名字叫Banjo班卓琴,弹奏出来的音乐很跳跃,甚至有些滑稽,我很喜欢,因为感觉很欢快,这种音乐的风格更准确地说是叫做Bluegrass,而其实我想找的Banjo准确地说是Bluegrass Banjo。

只可惜由于格盘,把我收集的几首bluegrass格掉了。

刚在网上找来了《冷山》的原声带,味道不错,放在这里,仅供品尝。

Posted by 西瓜 at 04:09 PM | Comments (0)

May 22, 2004

法语,法语,还是法语!


xigua
22:38 PM


定时和里昂那边的同学聊聊天,基本没有好消息,物价有多高,入学有多难……,不让自己做梦,也不给自己泼冷水,我知道,最重要的是语言,那边的同学不止一次地对我说,语言最重要,法语好,什么都好!

法语啊法语,怎么样可以学好法语啊,Il est très très très très très difficile.

跟外教练了几天口语,好累哦,下课后,还保持上课时的状态一样,有点停不下来,怪怪的。

总结一些这几天上的东西,

第一天讲的是古典音乐,嗨,说句实话,完全不懂古典音乐,就听着他们说出一个又一个的音乐家:莫扎特Mozart,贝多芬Beethoven,巴赫Bach,肖邦Chopin,舒伯特Schubert,嗨,反正很多,我也记不住,他们连这些古人的生日籍贯都知道,嗨,我这种文盲,真是无语。然后Michael(就是外教)又逼着我们说,不得不投入一点。Oui,Oui,Oui,点头就是了,呵呵。

为什么会讲古典音乐呢,因为先是做了一片阅读,说的是古典音乐可以推动顾客在餐厅里花更多钱点更贵的菜。嗨,也就这么回事,阅读嘛,知道大概什么意思不错了。

还有,我们叫银泰magasin,grand magasin,错了,其实应该叫
un centre commercial.

最后的绕口令比较有趣,也比较难的,记住的不多:
1.Je cherche Serge.
2.C'est trop trad pour le tram 33.
3.Cinq chiens chassent six chats.

第二天讲了各种各样的老年病,le cancer de ..., l'hypertension, le diabere, l'adipose, la presbytie, un rhumatisme, l'ostheoprose, 忘了什么意思,备着,又空查.

第三天讲名人,因为听成了性格,准备了一堆描述性格的形容词,白搭,上课的时候,Michael让我们说法国的名人,结果只有一个Zidane上了法国人评的十大名人,嗨,连大鼻子情圣和让雷诺都没上十大。第一大名人竟是一位教父,Abbe Pierre.

今天讲中国的名人,准备的是袁隆平,但是一个jj也准备了袁隆平,后来我就讲了杨利伟,嗨,有什么可以讲出来的,两三句话之后,我就说,C'est tout.

课堂上留下一个争议,我们说邓亚萍获得四次奥运冠军,Michael不相信,因为四年才一次奥运会,刚才查了下资料,好像是我们错了,错得不是很严重,她确实是四次奥运冠军,但是却是只参加了两届,因为是单打冠军,和双打冠军,所以她才有四次。

Posted by 西瓜 at 10:38 PM | Comments (0)

May 18, 2004

中国十大名人


xigua
19:45 PM


给法国老外介绍中国的名人,要活着的,谁能帮我推荐推荐。

目前候补的:

袁隆平,理由:杂交水稻之父,解决几亿人民吃饭问题。

杨利伟,理由:航天英雄

姚明,理由:NBA明星

Jacky Chan,理由:电影明星

吴宇森,理由:电影导演

巩俐,理由:据说她的一块广告牌在法国放了3年还没摘

张曼玉,理由:国际电影明星,嫁给了法国人,不过好像又改嫁了

李嘉诚,理由:中国最杰出的企业家。

周星驰,理由:中国最知名的喜剧演员。

高行健,理由:瑞典文学院将2000年诺贝尔文学奖授予中文作家高行健,不过好像不是中国籍了

Posted by 西瓜 at 07:45 PM | Comments (0)

May 17, 2004

myshow.cn让人人都有个人网站


xigua
16:39 PM


今天看到一个好玩的东西,通过简单的安装跟运行,可以使你的个人电脑变成服务器,只要你的电脑接通网络,那么,别人就可以通过yourname.myshow.cn访问你的网站(其实就是你的电脑)。你的硬盘有多大,你的网站就有多大。

使我觉得很有意思的是,这个小软件(myshow tool)装好之后,你的网站不止是个人网页,它还整合了一个相册,这个相册使用起来很方便,你只需把图片放在特定文件夹里面,它就会给你生成动态网页,清清爽爽展示你的图片。除了相册,更让人激动的是,它还为你安装了一个论坛,操作起来非常傻瓜。另外就是网络硬盘,所以有人就把自己的电脑做成了mp3下载站点,你甚至可以放一部片子在你的网站上,当然前提是你的网络条件很好,比如宽带,

而我,因为是在校园网内,带宽小,关卡多,速度就慢了,通过以下网址可以访问我的麦秀: http://xigua.myshow.cn

Posted by 西瓜 at 04:39 PM | Comments (0)

May 16, 2004

2004/05/16

刚刚听完郑强教授的演讲,因为去晚了,所以是站在演讲厅的门外听的,人多了一些。郑强教授不愧为浙大学生最喜爱的老师,他的话,既幽默,更坦诚,我们站在门外的同学也不禁为他鼓掌。

郑强教授给我们年青人,特别是我们这些男生,提出了很多忠告。我也加了自己的想法进去:

大学即将毕业的我们,很多都没有女朋友,不少还没有谈过恋爱,我们完全没有必要为这些事情而烦恼,不要怕漂亮女孩子都被追走了,确实,漂亮女孩的身边会有很多追求者,但是其中不少是没有真本事,没有真知识的,我们这些男生,我们这些有抱负,有理想的,虽然还没有女朋友的男生,我们应该思考的是,如何去学自己想学的东西,如何学好它,学扎实,以后如何报效祖国,真正踏踏实实学习的男生,不怕没有女生喜欢,真正有本事有知识的男生,自然会有漂亮的女生愿意和你恋爱。我们的女生要矜持,要给我们的男生一些时间,要选择我们有责任心,有知识,优秀的男生,我们的男生不要心急,要有信心,要有理想,要努力奋斗。

郑强教授也为我们这些搞研究的知识分子摆正了位子,我们不要被金钱迷惑,知识分子要有知识分子的尊严,知识分子是非常受尊重的,我们不要为找工作烦恼,我们需要有我们的气节,认认真真去爱我们的研究,为知识研究,为真理研究。

对于专业问题,郑强教授也忠告我们不要盲目去学热门专业,去学化学,去学农学,去学什么都是很有前途,我们要去学自己喜欢的,想要学的东西……

郑强教授的演讲很精彩,在这里我只能留些碎言碎语,纪念纪念,借鉴借鉴。

Posted by 西瓜 at 10:38 PM | Comments (0)

May 12, 2004

一个东方男孩的求学梦

拿着贴满了邮票的一封信,我朝邮筒走去,邮递员刚要走,我叫住了他,一双被雨打湿的手
接过我的信,塞进鼓鼓的布袋里,他跳上自行车,骑了回去。

这是一封发往巴黎的申请信,虽然并没有抱太大期望,但是这样淅沥的大雨,这样忙碌的邮
递员,这样的情景使我意识到,我的信承载着我的梦。

Posted by 西瓜 at 05:53 PM | Comments (0)

May 10, 2004

[转]世界最高生活质量城市排名


由英国默瑟人力资源咨询公司公布世界最高生活质量城市排名,在全球 215 个参选城市中,瑞士的苏黎士第二年蝉联榜首。排名第二和第六的城市也分别是瑞士的日内瓦和伯尔尼。

这个排名标准参照经济环境、教育水平、社会制安、交通系统、医疗及休闲娱乐设施水平等。由此可见瑞士这几个城市的综合社会水平在世界上都是顶尖的。

瑞士是地处欧洲中部的小国,因其湖光山色优美宁静、“永久中立”的地位和独特的“银行保密法”等因素,吸引了全球各地的富豪来此定居。世界各跨国公司、财团老总、著名运动员、艺术家等纷纷选择来瑞士。如生产万宝路香烟的菲利蒲 . 毛利斯公司在 2003 年把全球总部从美国搬迁到瑞士的洛桑、宜家( IKEA )家具公司的老板住在瑞士沃州、著名一级方程式赛车手舒马赫住在沃州的 ROLLE 镇、著名电影演员英格利 . 鲍曼在沃州 MORGE 市住了 30 多年,等等。

瑞士的日内瓦被誉为世界之都,有超过 200 多个国际机构,如联合国欧洲总部、世界贸易组织 WTO 、世界卫生组织、世界红十字会等;有 150 多个外国政府或非政府常驻机构,如中国在瑞士的 3 个大使级外交机构中有 2 个设在日内瓦;日内瓦每年召开 7000 多个国际性会议,如国际电讯展、日内瓦汽车展等。

瑞士良好的教育体系,培养出许多世界知名人物,如联合国秘书长安南、刚获得美国“超级星期二”竞选胜利的共和党候选人克里、著名电影演员史泰龙等等都毕业于瑞士学校。

以《罗马假日》、《窈窕淑女》等影片而风靡世界的美国著名女星奥戴丽.赫本与瑞士有着不解之缘,可以说瑞士是她的第二故乡。作为联合国儿童基金会亲善大使的她,在她1993年临终前的40年一直住在瑞士洛桑城外的一个叫TOLOCHENAZ的小村庄里。这里毗邻美丽的日内瓦湖,周围被大片葡萄园所包围,远处还能看见雄伟的阿尔卑斯山脉。为了纪念这位杰出女性,当地已将一所学校改建为奥戴丽.赫本展览馆,通过大量图片和宣传画,展示了她璀璨的一生。这个展览馆考当地居民自发创办经营,门票收入的一部分捐献给联合国儿童基金会。

生活质量排名前十城市
今年排名 去年排名 城市 国家
1. 1 苏黎世 瑞士
2. 2 日内瓦 瑞士
3. 2 温哥华 加拿大
4. 2 维也纳 奥地利
5. 5 奥克兰 新西兰
6. 5 伯尔尼 瑞士
7. 5 哥本哈根 丹麦
8. 5 法兰克福 德国
9. 5 悉尼 澳大利亚
10. 10 阿姆斯特丹 荷兰


生活?瑞士是我最向往的地方,
旅游?瑞士达沃斯是我最向往的地方,
工作?瑞士生物信息研究所是我最向往的地方,

我在网上找来一些瑞士的图片:

欧洲之巅-少女峰


雪山,火车,野花

雪山,绿草,人家



达沃斯-格劳宾登州典型的瑞士山川田园风光。

达沃斯-从北向南的空中摄影,达沃斯地区属于瑞士最大风景区(254km²

达沃斯有115公立自行车道路,无论你是骑山地车还是儿童自行车都能在这里领略瑞士特有的田园景色。

格劳宾登州著名滑雪圣地库尔(Chur)和阿罗萨(Arosa)之间有一个鲜为人知仙境--杉翡克(Schanfigg)。

沃州日内瓦湖畔洛桑(Lasanne)与沃韦(Vevey)之间的里瓦兹(Rivaz)一瞥。

格劳宾登州的多姆莱施克(Domleschg)的春天

伯尔尼州高原地区春天格林登瓦尔德(Grindelwald)的艾格峰(Eiger)(3970m)。

民间乐器

教堂,烟火(苏黎世)

城市,湖水(苏黎世)

苏黎世湖

苏黎世远景

鸟瞰首都伯尔尼

联邦大厦会议厅

伯尔尼市中心

特色建筑

日内瓦湖

勃朗桥、城市

勃朗桥、国旗

城堡

飞机,城市

联合国魂天仪

万国宫瑞士旗

湖泊帆船

依山傍水--洛桑


娜拉的瑞士梦想之旅,十大滑雪胜地,瑞士风光欣赏竟在http://www.myswitzerland.com.cn/

还有,
《别爱苏黎世》--中国女孩在瑞士的留学故事,还没来得及看,听说:“《别爱苏黎世》是一部自传,是千千万万个中国女孩在瑞士--这个美丽而富饶,骄傲而保守的欧洲内陆小国,用自己的年轻与热忱,眼泪与鲜血谱写出的一部部乐章。”。

还有,瑞士国立大学对中国留学生的录取条件

Posted by 西瓜 at 11:01 AM | Comments (0)

May 07, 2004

无论如何也要自己试一试

虽然都交了中介费了,虽然法语烂,虽然时间不多,可我还想试着自己申请,就从读这张网页开始
http://www.upmc.fr/FR/info/34/03#etu_etr

-------- INSCRIPTION EN CYCLE "Master" --------


La "dérogation de titres"

C'est une procédure réservée uniquement aux candidats non titulaires des diplômes d’accès requis pour une inscription automatique, notamment les titulaires de diplômes étrangers. C'est une décision pédagogique et administrative accordée pour l'année qui permet une inscription à l'Université et tient compte du niveau du candidat et du cursus souhaité. Elle doit être faite préalablement à toute demande d'inscription. Des pièces justificatives vous seront demandées afin de permettre à la commission d'étudier votre demande.

Comment et quand demander une dérogation de titres


Pour s’inscrire en 2004-2005, les dossiers seront normalement disponibles à partir du 27 avril 2004.

Les dossiers de demande de dérogation de titre sont examinés par une commission pédagogique qui décide de la suite à donner . Il est rappelé que la remise d'un dossier n'engage en rien l'université.

Chaque étudiant recevra un courrier l'informant de la suite donnée à sa demande d'inscription.

[ Attention pour les diplômes suivants :
Licence Technologie mécanique, magistères et les diplômes d'ingénieurs : IST, IFITEP, les dates de recrutement peuvent être différentes de celles énoncées ci-dessous, veuillez prendre contact directement avec le secrétariat pédagogique (consultez le document pdf > liste)


La traduction des diplômes, relevés de notes et programmes


doit être effectuée par un traducteur expert près de la Cour d'Appel de Paris. Les originaux des diplômes et de leur traduction sont toujours exigés: il ne faut pas les oublier dans son pays d'origine.

> Consultez la liste des traducteurs interprètes agréés

Remarque :

Il est recommandé aux étudiants souhaitant s’inscrire en master de mener parallèlement une demande d’admission préalable en cycle Licence ; en effet, les études universitaires effectuées, dans le pays d’origine, peuvent ne pas être reconnues comme suffisantes pour l’entrée en master.

Université Pierre et Marie Curie
4 place Jussieu 75252 Paris cedex 05
Service de la Scolarité - cycle Master
Scolarite.Maitrise@upmc.fr / Scolarite.DEA-DESS@upmc.fr
Maîtrise : Tél. 01 44 27 39 57 / 39 67 / 36 00
DEA-DESS : Tél. 01 44 27 33 08 / 25 12
Fax 01 44 27 35 77

Posted by 西瓜 at 10:19 PM | Comments (0)

[转]欧洲的中国,亚洲的法国

博客竟然不让我转载这篇文章,说是有敏感词汇。那我只能提供一个链接:
http://news3.xinhuanet.com/world/2004-04/14/content_1417633.htm

Posted by 西瓜 at 06:55 PM | Comments (0)

May 04, 2004

2004/05/04


xigua
11:57 AM


可能51那天太拼了,连续两天我都感觉很累,这个显示器令我反胃,

相反,51前的一段时间,每天早上起来,我都感觉自己的身体很亢奋,我很清楚原因,外
公是17岁成的家,我今年23周岁,

按照“成家,立业,治国,平天下”的顺序,是否一个人(特别是男人)应先有爱情,才
利于他的事业,而我还有几年的学业,

今天早上我起得晚,因为昨晚在寝室喝室友吃田螺喝老酒,一个绍兴人,两个宁波人,一
个乐清人,还有我这个余杭人,喝夜老酒的提议竟是乐清人提出的,

我比较喜欢早上起来先洗个澡,轻轻松松开始这一天,要淋浴,一边冲,一边思考,
这个时候我是最清醒的,这样子思考是我喜欢的一种状态,所以总是冲很久,幸好热水器够
大,室友也因此经常和我开玩笑,你在里面干嘛?

一张马友友的大提琴,一张莫扎特的小提琴协奏,还有一本Linux下的Perl编程,我决定这
样开始,

Posted by 西瓜 at 11:57 AM | Comments (0)

May 01, 2004

PIFdb --> SRS (2)


xigua
23:02 PM


本以为51没得玩了,想不到,花了一天,竟然完成了,现在SRS上的PIFdb数据库已经可以正常使用了。哈哈哈,数据库也不过如此嘛,还以为有多高深呢。不过,我也付出了代价,晚饭也没有吃。

最终写成了这样三个文件:
pif.is

以下内容为程序代码:
#!/bin/env icarus
$rules={
# the entry
entry: ~ {$In:[file:text] $Out pre $Skip:0}
('ID' {$Not} ln)*
('ID' {$entryFip=$Fip $Wrt} ln {$App}
('ID' {$Not} ln {$App})*)?
~
ln: ~ /[^\n]*\n/ ~
# the datafields
fields:~ {$In:entry $Out $Skip:1}
f_id f_xx* f_de?
~
f_id: ~ {$Wrt:id} 'ID' ln ~
f_xx: ~ {$Wrt:xx} 'XX' ln ('XX' ln)* ~
f_de: ~ {$Wrt:de} 'DE' ln ('DE' ln)* ~
f_ac: ~ {$Wrt:ac} 'AC' ln ~
f_dt: ~ {$Wrt:dt} 'DT' ln ('DT' ln)* ~
f_os: ~ {$Wrt:os} 'OS' ln ~
f_oc: ~ {$Wrt:oc} 'OC' ln ('OC' ln)* ~
f_dr: ~ {$Wrt:dr} 'DR' ln ~ #EMBL Number
f_fl: ~ {$Wrt:fl} 'FL' ln ~
f_if: ~ {$Wrt:if} 'IF' ln ('IF' ln)* ~
f_ad: ~ {$Wrt:ad} 'AD' ln ~
f_sq: ~ {$Wrt:sq} 'SQ' ln (' ' ln)* ~
# indexing
tag: ~ /../ ~
word: ~ /[a-zA-Z0-9_]+/ ~
noword: ~ /[^a-zA-Z0-9_]+/ ~
i_id: ~ {$In:[fields c:id] $Out:id}
tag word {$Wrt} ~
i_de: ~ {$In:[fields c:de] $Out:de}
tag (word {$Wrt}|noword)* ~
i_ac: ~ {$In:[fields c:ac] $Out:ac}
tag word {$Wrt} ~
i_dt: ~ {$In:[fields c:dt] $Out:dt}
tag (word {$Wrt}|noword)* '\n'
(tag (word {$Wrt}|noword)* '\n'[img]/images/wink.gif[/img]* ~
i_os: ~ {$In:[fields c:os] $Out:os}
tag (word {$Wrt}|noword)* '\n'
(tag (word {$Wrt}|noword)* '\n'[img]/images/wink.gif[/img]* ~
i_oc: ~ {$In:[fields c:oc] $Out:oc}
tag (word {$Wrt}|noword)* '\n'
(tag (word {$Wrt}|noword)* '\n'[img]/images/wink.gif[/img]* ~
i_dr: ~ {$In:[fields c:dr] $Out:dr}
tag 'EMBL;' word{$Wrt} ~
i_fl: ~ {$In:[fields c:fl] $Out:fl}
tag word{$Wrt} ~
i_ad: ~ {$In:[fields c:ad] $Out:ad}
tag /\S*/ {$Wrt} ~
}
# testing
if: $TestMode {
$job = $Job:[prod:$rules
skip:' \t'
fileName:"/home/database/pif/os.pif"]
while:$job.hasInput {
#$job.tokens:[entry print:y]
#$job.tokens:[fields print:y]
$job.tokens:[de print:y]
$job.tokens:[ad print:y]
$job.reset
}
}
job.reset
}
}

pif.i


以下内容为程序代码:
$PIF_DB=$Library:[PIFDB group:$PIF_LIBS
res:$PIF_RES
format:$PIF_FORMAT maxNameLen:30
searchName:'*.pif'
# files:{
# $LibFile:os
# }
]
$PIF_FORMAT=$LibFormat:[fileType:$PIF_FILE syntax:$PIF_SYNTAX
fields:{
$Field:[$DF_ALL]
$Field:[$DF_ID code:id index:id indexToken:id]
$Field:[$DF_Description code:de index:str indexToken:de]
$Field:[$DF_PIF_ACC code:ac index:str indexToken:ac]
$Field:[$DF_Date code:dt index:str indexToken:dt]
$Field:[$DF_Organism code:os index:str indexToken:os]
$Field:[$DF_OC code:oc index:str indexToken:oc]
$Field:[$DF_EMBL_ACC code:dr index:str indexToken:dr]
$Field:[$DF_FL code:fl index:str indexToken:fl]
$Field:[$DF_AD code:ad index:str indexToken:ad]
}
]

$PIF_SYNTAX=$Syntax:[file:"SRSDB[img]/images/tongue.gif[/img]if.is" ignore:' \t']

$PIF_FILE=$FileType:[text maxline:100
]


pif.it


以下内容为程序代码:
$PIF_RES=$Resource:[
description:
|PIFdb ( A Database of Potential Transcription Initiation Frequency [img]/images/wink.gif[/img]

| Current Release 1

|PIFdb is a database of potential transcription initiation frequency develop |ed and maintained by the Institute of Bioinformatics (IBI-ZJU), Zhejiang University, China.
www:
|The homepage of PIFdb ( http://ibi.zju.edu.cn/bioinplant/pif/pif_homepage.htm [img]/images/wink.gif[/img]
]

Posted by 西瓜 at 11:02 PM | Comments (0)

PIFdb --> SRS (1)

这简直是解读天书,SRS是英国的LION公司开发的数据库平台,有他独特的语法规则($rule),这些语法代码就是一本天书。

截取genbank.is中的一小段:

以下内容为程序代码:
$rules={
# entry and fields
entry: ~ {$In:[file:text] pre {$write=1 $Skip:0} $Out}
('LOCUS ' {$Not} lnT)*
(/LOCUS +([^ \n]+)[^\n]*\n?/ {$entryFip=$Fip $entryName=$1 $str=$Ct}
( 'VERSION ' {$Not} (lnT {$str.+=$Ct}))+
/VERSION +([A-Z_0-9]+)[^\n]*\n?/ {$acc=$1 $str.+=$Ct
if[img]/images/frown.gif[/img]$checkname.!='[img]/images/wink.gif[/img] {
# We need to check that we can use this entry
$filelist=$gbcheck.query:["[($checkname)-acc[img]/images/frown.gif[/img]$acc)]" sortOn:dat sortDir:2]
if[img]/images/frown.gif[/img]$filelist.size:[]>1) {
$hit=$filelist.getEntry
$ver=$JobFile.name:name
if[img]/images/frown.gif[/img]$ver.!=$hit.entry_nm) {
$Print:|Not using $acc from $ver - will use $hit.entry_nm
$write=0
}
}
}
if[img]/images/frown.gif[/img]$write==1) $Wrt:[s:$str]}
(/[O\/][R\/]/ {$Not} lnT {if[img]/images/frown.gif[/img]$write==1) $App})* ln?)?
~
lnT: ~ /[^\n]*\n?/ ~ # line terminator may be missing if truncated
fields: ~ {$In:entry $Out $Skip:1}
(ftList | / *([A-Z]+)[^\n]*\n/
{if:$fn.$1.=="" $dpe:"+++ unknown: $1 in $entryName +++"
$Wrt:$fn.$1} (/ [^\n]+[\n]+/ {$App})*)+ ~
ftList: ~ /FEATURES[^\n]*\n/ {$Wrt:ftTitle}
(/ [^ ][^\n]+\n/ {$Wrt:ft} / [^\n]+\n/* {$App})+ ~


到现在为止,我对$rule的几个关键命令有了一点了解,照样画葫芦,写了pif.is,已经可以分离出ID(识别号)和DE(描述)信息。


以下内容为程序代码:
#!/bin/env icarus
$rules={
# the entry
entry: ~ {$In:[file:text] $Out pre $Skip:0}
('ID' {$Not} ln)*
('ID' {$entryFip=$Fip $Wrt} ln {$App}
('ID' {$Not} ln {$App})*)?
~
# ln: ~ /[^\n]*\n/ {$Print:"...the line is |$Ct|\n"} ~
ln: ~ /[^\n]*\n/ ~
# the datafields
fields:~ {$In:entry $Out $Skip:1}
f_id f_xx* f_de?
~
f_id: ~ {$Wrt:id} 'ID' ln ~
f_xx: ~ 'XX' ln ('XX' ln)* ~
f_de: ~ {$Wrt:de} 'DE' ln ('DE' ln)* ~
# indexing
tag: ~ /../ ~
word: ~ /[a-zA-Z0-9_]+/ ~
noword: ~ /[^a-zA-Z0-9_]+/ ~
i_id: ~ {$In:[fields c:id] $Out:id}
# tag (word {$Wrt}|noword)* ~
tag word {$Wrt} ~
i_de: ~ {$In:[fields c:de] $Out:de}
tag (word {$Wrt}|noword)* ~
}

# testing

if: $TestMode {
$job = $Job:[prod:$rules
skip:'\t'
fileName:"/home/database/pif/os.pif"]
while:$job.hasInput {
$job.tokens:[entry print:n]
$job.tokens:[fields print:y]
#$job.tokens:[de print:y]
$job.reset
}
}


这里要注明的是,zy所写的PIFdb记录为了保持格式的美观,所以插入了一些空行,但是这些空行又并非空行,而仅仅是两个字符XX,并且出于开头。所以,我插入了 f_xx: ~ 'XX' ln ('XX' ln)* ~ 以匹配这样的空行。与之相对应的,fields也被修改为: fields: ~ $In:entry $Out $Skip:1} f_id f_xx* f_de? ~ 即插入了 f_xx

Posted by 西瓜 at 09:07 AM | Comments (0)