April 24, 2006

把曾经在blogcn写的blog全部转移过来

终于把我在03年6月到04年底写在blogcn(博客中国)的所有blog都导入到现在的MT系统。你可以看到我的“每月存档”多了很多个月,“分门别类”里面也多了一个Catelogy 2003 - 2004. 实现从blogcn搬家到MovableType不是容易的事,我的做法是,先是下载所有在blogcn的网页(很可惜,只剩正文,留言都下载不到了。) 然后编写了一个程序,用来提取网页里面有用的信息。比如,发贴时间,发贴的正文。然后再写成MT可以导入的格式,这个格式是这样的:

AUTHOR: augix
TITLE: 保护我们的大豆
STATUS: Publish
ALLOW COMMENTS: 1
CONVERT BREAKS: __default__
ALLOW PINGS: 0
CATEGORY: 2003 - 2005
DATE: 04/02/2004 01:30:22 PM
-----
BODY:
刚刚给fansile回了信,是关于保护我们国家自己的大豆品种的问题,
我觉得写出来,让大家讨论讨论这个问题还是很有意义的。
----

在MT里导入就是非常简单了。下面的列表就是导入的161个blog纪录。

Importing entries into blog 'augix.com |  伦敦  巴黎  里昂'
Importing entries as author 'augix'
Importing entries from file 'Untitled.txt'
Creating new category ('2003 - 2005')...ok
Saving entry ('嘿嘿')... ok (ID 205)
Saving entry ('开同学会')... ok (ID 206)
Saving entry ('我回学校了')... ok (ID 207)
Saving entry ('我报了上海2004年4月份的TEF考试')... ok (ID 208)
Saving entry ('理一下头绪')... ok (ID 209)
Saving entry ('今天的两个主题:squid和BLAST')... ok (ID 210)
Saving entry ('wwwBLAST调试成功,squid实现ip控制')... ok (ID 211)
Saving entry ('用于精简conf文件的脚本')... ok (ID 212)
Saving entry ('到处都是烟花的寂寞')... ok (ID 213)
Saving entry ('赶回实验室')... ok (ID 214)
Saving entry ('小结:过完年到今天')... ok (ID 215)
Saving entry ('刚完成的程序代码(GC123)')... ok (ID 216)
Saving entry ('CGI心得(一)')... ok (ID 217)
Saving entry ('Cool! DELL Workstation!')... ok (ID 218)
Saving entry ('中国的第一职业---公务员')... ok (ID 219)
Saving entry ('今夜,找个陌生人rendez-vous')... ok (ID 220)
Saving entry ('今夜找个陌生人rendez-vous(2)')... ok (ID 221)
Saving entry ('bak.ChrMatrix->doubleHits')... ok (ID 222)
Saving entry ('bak.findline->Maize')... ok (ID 223)
Saving entry ('《迷失东京》')... ok (ID 224)
Saving entry ('适合浙大校内架设squid代理服务器的squid.conf')... ok (ID 225)
Saving entry ('梦中的她')... ok (ID 226)
Saving entry ('开完同学会')... ok (ID 227)
Saving entry ('Il n'y a pas de temps')... ok (ID 228)
Saving entry ('后基因组时代的科普之一')... ok (ID 229)
Saving entry ('Les nouveaux programmes: pour maize')... ok (ID 230)
Saving entry ('Les vallées d'Irlande')... ok (ID 231)
Saving entry ('绿魂活动花絮')... ok (ID 232)
Saving entry ('记香街游行(中国人在巴黎过春节)')... ok (ID 233)
Saving entry ('法国科学家愤怒了')... ok (ID 234)
Saving entry ('如果我说我不明白')... ok (ID 235)
Saving entry ('法语的起源和发展')... ok (ID 236)
Saving entry ('FOR base')... ok (ID 237)
Saving entry ('What are ESTs ?')... ok (ID 238)
Saving entry ('张生记的学术晚宴')... ok (ID 239)
Saving entry ('Go to West')... ok (ID 240)
Saving entry ('三位最重要的启蒙思想家')... ok (ID 241)
Saving entry ('绘制最终图的第一晚')... ok (ID 242)
Saving entry ('中心南楼604')... ok (ID 243)
Saving entry ('西瓜的起源学说____西瓜的感恩(一)')... ok (ID 244)
Saving entry ('Base-Distribution (这两天赶时间做的程序)')... ok (ID 245)
Saving entry ('我的新程序GCnew.pl')... ok (ID 246)
Saving entry ('今晚什么事情都不做。')... ok (ID 247)
Saving entry ('用于从多条GenBank格式记录中提取cDNA序列并以Fasta格式保存的程序')... ok (ID 248)
Saving entry ('浙江大学GPA计算软件烂西瓜版')... ok (ID 249)
Saving entry ('即将完成的主页')... ok (ID 250)
Saving entry ('这样的早晨')... ok (ID 251)
Saving entry ('西瓜回了趟家')... ok (ID 252)
Saving entry ('环境变量与远程登陆linux')... ok (ID 253)
Saving entry ('仍然SRS')... ok (ID 254)
Saving entry ('还想去西湖吗?')... ok (ID 255)
Saving entry ('保护我们的大豆')... ok (ID 256)
Saving entry ('TEF')... ok (ID 257)
Saving entry ('恩波第一天')... ok (ID 258)
Saving entry ('雨中漫步')... ok (ID 259)
Saving entry ('我的TEF之行')... ok (ID 260)
Saving entry ('签了协议')... ok (ID 261)
Saving entry ('真是没有想到')... ok (ID 262)
Saving entry ('已经在法国的朋友发来的照片')... ok (ID 263)
Saving entry ('这个假期没得玩')... ok (ID 264)
Saving entry ('PIFdb --> SRS (1)')... ok (ID 265)
Saving entry ('PIFdb --> SRS (2)')... ok (ID 266)
Saving entry ('2004/05/04')... ok (ID 267)
Saving entry ('[转]欧洲的中国,亚洲的法国')... ok (ID 268)
Saving entry ('无论如何也要自己试一试')... ok (ID 269)
Saving entry ('[转]世界最高生活质量城市排名')... ok (ID 270)
Saving entry ('郭庆民考研英语《阅读理解》笔记')... ok (ID 271)
Saving entry ('一个东方男孩的求学梦')... ok (ID 272)
Saving entry ('2004/05/16')... ok (ID 273)
Saving entry ('myshow.cn让人人都有个人网站')... ok (ID 274)
Saving entry ('中国十大名人')... ok (ID 275)
Saving entry ('法语,法语,还是法语!')... ok (ID 276)
Saving entry ('Cold Mountain')... ok (ID 277)
Saving entry ('散伙饭')... ok (ID 278)
Saving entry ('血腥又好玩的flash----happy tree friends')... ok (ID 279)
Saving entry ('讲讲陈旧的教育制度是如何摧残我们的童年的。')... ok (ID 280)
Saving entry ('<>')... ok (ID 281)
Saving entry ('保护你的email地址信息')... ok (ID 282)
Saving entry ('三个寝室睡半数的人')... ok (ID 283)
Saving entry ('介绍好玩的东东(相册和画板)')... ok (ID 284)
Saving entry ('最近散漫')... ok (ID 285)
Saving entry ('非常气愤的事情')... ok (ID 286)
Saving entry ('我的Gmail')... ok (ID 287)
Saving entry ('谁能告诉我怎么回事,关于PayPal.com')... ok (ID 288)
Saving entry ('lanxigua.com和augix.com开通啦')... ok (ID 289)
Saving entry ('发觉现在比小时候笨多了')... ok (ID 290)
Saving entry ('想要KISS不容易')... ok (ID 291)
Saving entry ('Egypte antique跟世界语Esperanto')... ok (ID 292)
Saving entry ('第一节法语课')... ok (ID 293)
Saving entry ('毕业篮球赛')... ok (ID 294)
Saving entry ('一路顺风,小波。')... ok (ID 295)
Saving entry ('会读法文单词了')... ok (ID 296)
Saving entry ('两个Gmail名额')... ok (ID 297)
Saving entry ('我的法文blog')... ok (ID 298)
Saving entry ('Lecon trois的对话')... ok (ID 299)
Saving entry ('利用cgi获取服务器信息以及一张学士照')... ok (ID 300)
Saving entry ('为什么一个礼拜没有留日志')... ok (ID 301)
Saving entry ('离寝手续')... ok (ID 302)
Saving entry ('今天也是我的生日')... ok (ID 303)
Saving entry ('蛋糕的名字----柠檬之恋')... ok (ID 304)
Saving entry ('本blog已转移')... ok (ID 305)
Saving entry ('我想上网啊!')... ok (ID 306)
Saving entry ('终于拨上来了')... ok (ID 307)
Saving entry ('第一次玩BLOG')... ok (ID 308)
Saving entry ('今天下地')... ok (ID 309)
Saving entry ('又干活')... ok (ID 310)
Saving entry ('郁闷啊,看课件')... ok (ID 311)
Saving entry ('本学期第一次考试')... ok (ID 312)
Saving entry ('放了网页在实验室')... ok (ID 313)
Saving entry ('我恨蚊子')... ok (ID 314)
Saving entry ('茶学SB版补丁')... ok (ID 315)
Saving entry ('宝马出的自行车')... ok (ID 316)
Saving entry ('茶学考试')... ok (ID 317)
Saving entry ('生物信息')... ok (ID 318)
Saving entry ('自修去了')... ok (ID 319)
Saving entry ('田原-跳房子')... ok (ID 320)
Saving entry ('自修归来')... ok (ID 321)
Saving entry ('6.15.14.22')... ok (ID 322)
Saving entry ('Fatal Error')... ok (ID 323)
Saving entry ('是我在飞行')... ok (ID 324)
Saving entry ('被小明偷拍')... ok (ID 325)
Saving entry ('蛋白质数据库')... ok (ID 326)
Saving entry ('BT的植物病理学考试')... ok (ID 327)
Saving entry ('刚刚把课程论文交了')... ok (ID 328)
Saving entry ('How to choose a watermelon?')... ok (ID 329)
Saving entry ('26 décembre 2003')... ok (ID 330)
Saving entry ('27 décembre 2003')... ok (ID 331)
Saving entry ('Expressions usuelles')... ok (ID 332)
Saving entry ('《黑白森林》')... ok (ID 333)
Saving entry ('Je m'appelle Hélène')... ok (ID 334)
Saving entry ('《双瞳Double Vision》')... ok (ID 335)
Saving entry ('30 décembre 2003')... ok (ID 336)
Saving entry ('Nous sommes le 1er janvier 2004')... ok (ID 337)
Saving entry ('动词变位présent')... ok (ID 338)
Saving entry ('1:36')... ok (ID 339)
Saving entry ('最快的64位个人电脑')... ok (ID 340)
Saving entry ('微软可能动用捆绑策略,Google会不会成为网景第二?')... ok (ID 341)
Saving entry ('samedi 03 janvier 2004')... ok (ID 342)
Saving entry ('Télécharger depuis RGP au lieu de NCBI')... ok (ID 343)
Saving entry ('男性Y染色体决定人类进化质量')... ok (ID 344)
Saving entry ('3点了')... ok (ID 345)
Saving entry ('明年这个时候会怎样?')... ok (ID 346)
Saving entry ('一个哥们的表白re上了88的十大')... ok (ID 347)
Saving entry ('C'est finit!')... ok (ID 348)
Saving entry ('郁金香芳芳Fanfan la tulipe')... ok (ID 349)
Saving entry ('朴树La perte')... ok (ID 350)
Saving entry ('关于留言簿')... ok (ID 351)
Saving entry ('考完了')... ok (ID 352)
Saving entry ('今晚帮师姐写的程序hitcount.pl')... ok (ID 353)
Saving entry ('电影《地下铁》里面的两首法语歌')... ok (ID 354)
Saving entry ('看文献,头好大!(NOTE1 for Paterson's pdf)')... ok (ID 355)
Saving entry ('看文献!看文献!')... ok (ID 356)
Saving entry ('这回又有钱了')... ok (ID 357)
Saving entry ('IBM的操作系统AIX')... ok (ID 358)
Saving entry ('我的挑战杯项目批下来了')... ok (ID 359)
Saving entry ('今天去玉泉领到了中英文成绩单')... ok (ID 360)
Saving entry ('新程序:从BLASTN结果中提取CDS位点')... ok (ID 361)
Saving entry ('终于作出了点矩阵图')... ok (ID 362)
Saving entry ('真是意外,我一下子没有目标了')... ok (ID 363)
Saving entry ('在实验室避暑')... ok (ID 364)
Saving entry ('about Dotti')... ok (ID 365)

All data imported successfully! Make sure that you remove
the files that you imported from the 'import' folder, so that
if/when you run the import process again, those files will not
be re-imported.
keywords: blogcn2MT

Posted by 西瓜 at 02:48 PM | Comments (0)

January 17, 2006

我写的一些小程序

昨天应luwei同学要求,写了一个小程序,Microsatellites Finder,用来搜索多序列中的微卫星序列。程序地址在:
http://www.augix.com/cgi-bin/Bioinfo/Microsatellites.cgi

我在国内时写了一些程序,有几个放在下面这个网页,但是我在浙大的文件都被删除了,他们都运行不了了。
http://www.augix.com/html/work/Didier.html

我到法国买了苹果机以后,写过一些帮助管理计算机,更好地组织信息的程序。只有一个帮助背单词的放在了网上:http://www.augix.com/FR.EN.CH/
这个程序的名字叫FR.EN.CH,是三种语言(French, English, Chinese)的结合,目前数据库里只有英法互译,你可以输入英文,查对应的法文单词,也可以做练习(选择题),来帮助背单词,不妨一试。

如果你们想要个什么程序,跟我讲,你们的要求会给我提供点子。我打算开始把空余时间花在整理,发布我的程序上了。

Posted by 西瓜 at 12:40 AM | Comments (11)

November 13, 2005

links for 2005-11-12

Posted by 西瓜 at 12:17 AM | Comments (4) | TrackBack

November 07, 2005

links for 2005-11-06

Posted by 西瓜 at 12:19 AM | Comments (1) | TrackBack

November 04, 2005

links for 2005-11-03

Posted by 西瓜 at 12:21 AM | Comments (0) | TrackBack

November 03, 2005

links for 2005-11-02

Posted by 西瓜 at 12:23 AM | Comments (0) | TrackBack

October 30, 2005

links for 2005-10-30

Posted by 西瓜 at 01:19 AM | Comments (1) | TrackBack

October 25, 2005

links for 2005-10-25

  • 有传媒报导他“背景复杂”,曾是北京中央广播电台军事部副主任,后下海经商,在杨尚昆系支持下向海外发展,取得美洲伯利兹护照,90年来香港,96年和传媒大王默多克合资创办凤凰卫星电
  • 《[1932年美国拖拉机进城回顾]》《李敖讲的美国军队开枪真象》《历史资料:李敖提到的1932年发生在美国的一场风波》《从李敖的清华演讲谈几个历史史实》
    (tags: li_ao)
  • (tags: photo science)
  • 1927年,年轻的李尧棠 (巴金) 从上海前往法国巴黎,原本想学经济,但一个偶然的机会,他一下子获得托尔斯泰、巴尔扎克、契诃夫、左拉等文学大师的作品,如饥似渴地阅读后,他被深深感动
  • 英语中最著名的一个回文,是拿破仑被流放到Elba岛时说的一句话:Able was I ere I saw Elba(在我看到Elba岛之前,我曾所向无敌),这句话不论是从左向右看,还是从右向左看,内容都一样。(拿破仑
    (tags: english)

Posted by 西瓜 at 01:20 AM | Comments (1) | TrackBack

October 24, 2005

有创世主留下信息吗?

一篇名为《Message in the Sky》的文章说,假设创世主存在,那么宇宙微波辐射(CMB)是已知的,可以被创世主用作一种,(也是唯一的一种),给我们这些人留下信息的方法。

Yin Zhangqi说:

这篇论文中讨论了如果我们这个宇宙是由某个创世主创造的,而这个创世主创造宇宙的时候就想留下记号让宇宙中将来产生的高级智能生命发现,又不干扰宇宙产生后的变化,那什么记号最普遍最容易实现呢?他们给出的答案是宇宙微波背景幅射(CMB)。他们的计算发现CMB的温度方差的分布C_l可以用来储存信息。 他们估计在目前的实验条件下,最多能够解码的信息量是10^5比特。

现在火的是生物信息学,不知道“宇宙信息学”会不会火起来。 如果上帝存在,愿上帝保佑他们收到上帝的信息。

ps: Yin Zhangqi在blog《Message in the Sky》的时候,把作者的名字错写成Tsu,桑林志在引用Yin Zhangqi的blog的时候,也没有发现这个错误,就照抄了。

然后还有David Deutsch说,下面的这张CMB图像与我们的这个行星地图相像。

反正我是看不出来,天文学的东西听上去就够玄的了,突然想起来另一个新闻:
四川天文学家65年前用周易预测出第十大行星,说是:

当时只有27岁、在法国勤工俭学的四川人刘子华发现,太阳系的各星体与八卦的卦位存在着对应关系。他依据这个关系,利用天文参数进行计算,证明出每一对应卦位所属星体的平均轨道速度和密度均分别为一个密值。经过反复运算,刘子华终于第一个算出了第十颗行星的平均轨道运行速度为每秒2公里,密度为每立方厘米0.424克,离太阳的平均距离为74亿公里,按照希腊神话命名原则,在冥王星后面的应叫“木王星”。

这则新闻说得我不敢相信:

刘子华出生于1899年,龙泉洛带镇人。据李力知介绍,1919年,刘子华与陈毅、邓小平等赴法勤工俭学。在法留学26年,师从居里夫人、爱因斯坦、柏格森等世界级大师。

另外有关发现“第十大行星”的新闻就在这个月被报道:
美天文学家:太阳系"第十大行星"有卫星

Posted by 西瓜 at 05:25 PM | Comments (0) | TrackBack

links for 2005-10-24

Posted by 西瓜 at 01:20 AM | Comments (0) | TrackBack

October 22, 2005

links for 2005-10-22

Posted by 西瓜 at 01:19 AM | Comments (0) | TrackBack

October 08, 2005

links for 2005-10-08

Posted by 西瓜 at 01:19 AM | Comments (3)

October 07, 2005

links for 2005-10-07

Posted by 西瓜 at 01:19 AM | Comments (0) | TrackBack

September 29, 2005

links for 2005-09-29

Posted by 西瓜 at 01:20 AM | Comments (5) | TrackBack

August 20, 2005

基因决定交友与择偶的标准?

Posted by 西瓜 at 02:14 AM | Comments (2) | TrackBack

August 18, 2005

为何我能比法国同学考得好

朋友说开学的时候就正式进专业了,想从我这里取经。

坦率地说,我够用心,但是心有余,力没用足。所以成功的经验不多,前车之鉴不少。这里我讲几个事实,其中第7点回应了文章题目:


1。来法半年进专业,法语基础差,上课完全听不懂。
成功经验:尽早进专业,给自己施压,人都是逼出来的嘛。进专业也给自己创造了绝佳的语言环境。
前车之鉴:要尽早进专业,更要尽早提高法语水平。

2。跟4,5个同学在教室从白天讨论到晚上,因为第二天要交作业。
成功经验:尽早进专业,找尽机会跟同学讨论。跟同学讨论的时候,我感觉法语进步很快。
前车之鉴:法国学生的学习效率不高,讨论半天,抓不住要害。

3。每次上课都有种强烈欲望,就是拯救冷场,回答出老师的提问,或者突然指出老师的错误。
成功经验:有欲望才有热情,即使恐怖得想吐血,听得想自杀,都要幻想听懂的那一刻。
前车之鉴:急于求成,容易浮躁。
补充:中国学生是最聪明的,相信自己,等待机会,一鸣惊人,让他们知道中国学生的厉害。

4。录音mp3音质不好,所以也没怎么听。
补充:但是听一个南大的师姐说,她在尼丝的时候,每天的学习就是反复听录音,她的法语很好!

5。笔记做地不好,最后是印同学的。
解释:国内的经验是上课听懂最重要,课本上条条杠杠都有,不需要多少笔记。法国的情况是,学生没有很多教材,从小练就做笔记的本领,看看他们用多少种颜色的笔就知道了。如果上课是听不懂的,我们就要努力做笔记!课后就可以慢慢消化。

6。没有向老师提过一个问题。
解释:是由于太要面子。中学时向老师提问的情况,有挑战权威之嫌,大学时,不知道老师长什么样。而在这里,我反而怕老师觉得给我解释是件非常费劲的事情。所以,我没有提问过,使得到期末积累了很多的问题,复习起来,是自己非常费劲。正确的做法是,一有问题就要马上解决掉,应该去问。

7。为了完成Markov(马尔可夫)模型的TP作业,重写了老师的程序,看到了吃惊的表情,得到了18分的成绩。为了完成生物统计的TP作业,花了整整一个星期写了个完整的程序包,成为唯一被表扬的学生。
成功经验1:这个我要好好解释一番,因为这是我能考到第二名的原因。我的法语不好,即使专业知识掌握得再好,考试的时候也是没有机会用上它的,因为读个题目就把时间花掉了。而平时作业就不一样了,一道题目,我可以在家里读上一整天,说一整天一点不夸张,理解TP作业,有时需要去读懂几篇参考文献。然后再用一个星期的时间,穷我所能,把它做到完美。平时作业是我们能够把握住的,要好好利用,这些作业在最终的成绩里是占分数的,占得还不少,我的Markov TP成绩占了至少1/4,生物统计的TP成绩占了大概有1/2。
成功经验2:集中处理一个TP问题,也是锻炼专业能力的好机会。
前车之鉴:我在这两个程序上面,耗费了很多脑力,和体力,身体差了很多。
补充:程序写成的那一刻,兴奋到极点,整个人跳起来,被我认定是人生中最幸福的一刻之一。

最后,是关于时间的问题:
我的时间很多都浪费了。在作息紊乱的时候,在疯狂上网的时候,在发呆的时候,总是在不经意时让时间溜走。唯一让我觉得时间会多出来的地方,是图书馆。跟自修教室不同,图书馆不会让我打瞌睡,因为图书馆有很多书,看到一本书让我觉得看不下去的话,就换一本,有时当画册一样使劲翻,有时围绕一个主题,旁敲侧击,终究没有学不会的东西。正所谓,学习之道,不求甚解,每有会意,欣然忘食。

Posted by 西瓜 at 10:24 PM | Comments (8) | TrackBack

June 28, 2005

Master2的论文答辩

去听比我大一个年级(master2)师兄师姐的论文答辩。

  • 第一印象是他们好老。
    有师兄秃了头的,有白了发的,有拄拐杖的,有师姐黄了脸的,也有一些我这个年纪的同学。我想,那些年纪比较大的师兄师姐曾经也是这里毕业的,并且参加工作了,我想他们是matrise(bac+4)毕业,由于法国学位体系的改革(LMD化),他们又回来充电,拿个master(bac+5)。
  • 第二个印象是,我觉得他们大都是做数学的。
    虽然他们中很多人的课题是医学方向上的,但实质上只是数学(特别是统计学)在某个特定医学问题上的应用,他们讨论的是不同的数学模型的差异,而在医学机理(比如病理学)上的讨论很少很少,又如将数学应用到生物学问题上的课题,他们研究的仍然是模型,参数等,没有抓住生物学本质讨论。只有对于数据的分析,没有本质的,机理的,分析。但是在我看来,做生物学研究的终究是要研究生命的本质。现在生物信息学领域很热,因为是交叉学科,所以学数学的人可以转过来,学计算机的,学化学的,学物理的都可以转到这个领域来。但是,我觉得,从生物以外背景过来的人大多进行生物信息学方法的探索,而生命规律的研究仍然需要一定的生物学修养。

Posted by 西瓜 at 09:44 PM | Comments (5) | TrackBack

April 02, 2005

用python编写序列联配程序

ACGGTGCGGACCAAATCCTTAGACT
ACAGTGCAAACCAAATCACACCCCTTATT

对上面两条序列的进行联配(alignement),相同碱基配上加1分,不同碱基配对记作-1,一个gap记作-1,自左向右逐个完成配对,得到最大得分即为最佳联配。用python编写程序完成。老师写的程序只得到了一个匹配结果:

ACGGTGCGGACCAAAT______CCTTAGACT
ACAGTGCAAACCAAATCACACCCCTT__ATT

事实上,不同联配方式,得分可能均为最大值。我的程序比老师的短,并且考虑到了这一因素。 我的结果是:

score=7
ACGGTGCGGACCAAAT____CC__TTAGACT
ACAGTGCAAACCAAATCACACCCCTTAT__T
//
ACGGTGCGGACCAAAT____CC__TTAGACT
ACAGTGCAAACCAAATCACACCCCTTA_T_T
//
ACGGTGCGGACCAAAT____CC__TTAGACT
ACAGTGCAAACCAAATCACACCCCTTA__TT
//
ACGGTGCGGACCAAAT____CC__TTAGACT
ACAGTGCAAACCAAATCACACCCCTT__ATT
......

我的代码是:

#!/usr/bin/python
seq1='1'+'ACGGTGCGGACCAAATCCTTAGACT'
seq2='2'+'ACAGTGCAAACCAAATCACACCCCTTATT'
flag={};score={};flag[0,0]='';score[0,0]=0;newseq1={};newseq2={};position={}
def fonc(i,j):
	flag[i,j]='';newseq1[i,j]=[];newseq2[i,j]=[]
	if j==0: flag[i,j],score[i,j]='-',score[i-1,j]-1;return
	if i==0: flag[i,j],score[i,j]='|',score[i,j-1]-1;return
	if seq1[i]==seq2[j]: s=1
	else: s=-1
	AB,AG,GB=score[i-1,j-1]+s,score[i-1,j]-1,score[i,j-1]-1
	if AB>=AG and AB>=GB: flag[i,j]+='\\'; score[i,j]=AB
	if GB>=AB and GB>=AG: flag[i,j]+='|'; score[i,j]=GB
	if AG>=AB and AG>=GB: flag[i,j]+='-'; score[i,j]=AG
for j in range(len(seq2)):
	for i in range(len(seq1)):
		if i!=0 or j!=0: fonc(i,j)
print 'score='+str(score[i,j])
newseq1[i,j]=[''];newseq2[i,j]=[''];position[i,j]='true';newseq1[0,0]=[];newseq2[0,0]=[]
while i!=0 or j!=0:
	for i,j in position.keys():
		if i==0 and j==0: break
		del position[i,j]
		if '\\' in flag[i,j]:			
			newseq1[i-1,j-1]+=[seq1[i]+x for x in newseq1[i,j]]
			newseq2[i-1,j-1]+=[seq2[j]+x for x in newseq2[i,j]]
			position[i-1,j-1]='true'
		if '-' in flag[i,j]:
			newseq1[i-1,j]+=[seq1[i]+x for x in newseq1[i,j]]
			newseq2[i-1,j]+=['_'+x for x in newseq2[i,j]]
			position[i-1,j]='true'
		if '|' in flag[i,j]:
			newseq1[i,j-1]+=['_'+x for x in newseq1[i,j]]
			newseq2[i,j-1]+=[seq2[j]+x for x in newseq2[i,j]]
			position[i,j-1]='true'
for i in range(len(newseq1[0,0])):
	print newseq1[0,0][i]+'\n'+newseq2[0,0][i]+'\n//'

Posted by 西瓜 at 01:21 PM | Comments (3) | TrackBack

January 30, 2005

美食在线与外语视频

  • poco中国美食网
    向同学求教微波炉菜谱的时候,被推荐的,很多图片食物,那个叫诱人啊。喜欢会做菜的mm,只要给我做好吃的,马上就屈服。
  • 外语TV
    俄语,西班牙语,英语,意大利语,法语,德语,日语,阿拉伯语,很多语种的电视节目,我这里连接速度很快,也很稳定。

Posted by 西瓜 at 12:37 AM | Comments (0) | TrackBack

January 25, 2005

Google Scholar

Google Scholar


 Advanced Scholar Search
Scholar Help

Google Scholar对自己的定义简单地说就是他帮你找期刊论文、学位论文、书籍、预印品、文摘、技术报告等各种学术信息。

Scholar本身就有学者,学术的意思。说到底他还是个搜索引擎,而且他找到的东西还竟是大多数网民特别不感兴趣的东西。

那么如果你作学术研究,Google Scholar值得你去关注。

他的特点:

  • 过滤了网上的不相关信息,省去了初筛选的麻烦。
  • 按引用次数排序,类似于影响因子(IF),这是评价论文档次高低的重要因素。
  • 虚拟图书馆系统,他同大型图书馆的合作首先使得他提供了,全文不在网上公开的文献信息,其次,对于书籍,他提供书目信息,再通过Library Search检索到当地图书馆的馆藏信息。另外,同哈佛大学图书馆的合作使得该馆读者可以凭借图书馆PIN被允许阅读他搜索到相关文献内容,乔治亚州大学也是一样

而我想知道的是:

  • Google如何定义这些学术材料。
  • 哪种类型的信息被Google更好地收录了。
  • Google Scholar对于今后的学术研究以及学生学习有什么影响。

Reference (some of them not be read yet):


Tip: 只需要全文pdf,搜索时可以加上filetype:pdf

PS: 搜索了关键字rice genome,出现的第一条纪录是华大在science发表的那篇水稻基因组测序结果。4百多次被引用,有十多个网址提供下载全文,cab.zju.edu.cn(农学院)出现在显著位置,遗憾的是,出现404 Not Found错误。

Posted by 西瓜 at 12:35 AM | Comments (2) | TrackBack

January 16, 2005

关于搜索引擎

搜索引擎在我们的生活中越来越重要。关于搜索引擎的话题永远讲不完,我将一点一点学习,一点一点纪录下来。

  • Soople 推荐!他整合了包括普通google以外的许多的实用搜索技巧,如:
  • Yahoo! Video搜索,我用他搜索一些大学课程视频。
  • Babelplex
    Babelplex is a bilingual search service that searches the web in one language and in another language via a cross-language information retrieval system utilizing AltaVista - Babel Fish Translation, Google Translate, or Yahoo! Language Search Tools for translation and utilizing AltaVista, Google, or Yahoo! for search. 简言之,用一种语言的关键字,同时搜索两种语言的网页。
  • update(17jan05): 通过google,利用关键子filetype:ppt site:univ-lyon1.fr搜索到里昂一大的生物信息学上课资料和练习题。

一些教程:

Posted by 西瓜 at 03:31 PM | Comments (1) | TrackBack

January 15, 2005

小i机器人

今天我的小i脑子不太灵清,跟他说大便,他说:“我爱吃”。给我做心理测试,竟然是这样的结果:

小I心理测试系统
【性爱测试】......十张纸要你丢掉时……
测试结果如下:
是个凡事都要对方顺从自己意思的人,标准的自我中心主义分子,做爱时也从未考虑对方的感受,将女性当成性工具,是属于连钓鱼也不上鱼饵的类型,在女性的眼中或许外表上很有男性的气概,但除非她自己有喜欢被虐待的倾向,否则还是会一走了之的。

这个测试是非常荒唐的,但是小i确有很多非常实用的功能。
比如: 英汉互译,想像一下,你可以不必打开金山词霸或者别的软件,只需在msn messenger或者QQ里面对小i发个消息就可以。

事实上,小i是一个人工智能的聊天机器人,你甚至还可以教他聊天。目前,小i机器人家族一共有五位成员:MSN小i,QQ小i,TM小i,WEB小i,Yahoo小i。

他的功能有:成语词典,汉英互译,计算器,记事本,聊天室,看笑话,搜索歌词,歌曲下载,电视节目,电影介绍,心理测试,智力闯关,智力问答,成语接龙,城市信息,天气,火车, 酒店预定,历史上的今天,IP地址,查询汇率,体育信息......

添加小i非常方便,我的是小i朋友是ince284@hotmail.com
小i的官方站点是xiaoi.com

ps: 从小i那里知道了这个信息:
jl: 杭州 里昂
杭州到里昂之间的直线距离为9371.0公里。

Posted by 西瓜 at 09:07 PM | Comments (2) | TrackBack

January 14, 2005

法国国际广播电台

RFI - Radio France Internationale - 法国国际广播电台是我学习法语的参考资料之一。
他的华语节目也是我了解新闻的一个渠道,节目最开始的新闻内容较敏感,之后法国报刊选读,每次节目还推荐一首法语歌,介绍一点法语语法。可以在线收听,但他不保存过往节目内容。

点击这里下载1月14日节目。

Posted by 西瓜 at 11:57 PM | Comments (2) | TrackBack