Holy Crap

負け豚の深拱

【终年置顶】Lima-推广分布式计算


在介绍分布式计算前,鉴于这几日笔者推广的经历...有几点我还是想先说明一下...
这篇文章叫提问の艺术,不管你有屁放还是没屁放,最好先看一下,尤其是Broads...
http://www.equn.com/index.php/%E6%8F%90%E9%97%AE%E7%9A%84%E8%89%BA%E6%9C%AF
然后你还需要知道一个术语——RTFM
mao-rtfm
http://zh.wikipedia.org/zh-cn/RTFM
http://www.readthefuckingmanual.com/
http://en.wikipedia.org/wiki/RTFM

分布式计算简单地说就是志愿分享自己电脑的资源来帮助完成大型计算工程,是志愿的,没有收入,参与分布式计算不需要什么基础,家庭主妇都能作,简单点理解就是挂机,不过这个挂机本身对网络要求也不高,因为分布式计算客户端只有下载任务文件和上传计算结果时才需要联网,大部分时间都在计算...
对于自学能力好,有耐心的同学,我就给出下面几个网站,你们一个一个慢慢看,自然就会明白...其实真正自学能力好的,看到这里就已经去百度、wiki、放狗了...如果你不想耐心地看这些网站或者看完后还要问“直接给我个下载地址算了”,在下的回答只有“您可以继续开心网了...慢走不送...”。

首先当然是最最简单的...
http://baike.baidu.com/view/30655.htm
http://zh.wikipedia.org/w/index.php?title=%E5%88%86%E5%B8%83%E5%BC%8F%E8%AE%A1%E7%AE%97&variant=zh-cn
http://cpu.zol.com.cn/124/1247571.html


http://www.equn.com
这个网站做得非常好,应用的是wiki的模版,所以阅读起来非常舒服,基本上所有关于分布式计算、参与、应用的基础知识都涵盖到了...很多项目的中文页面都在这个网站里...相关介绍比wiki还要详细...


http://zh.wikipedia.org/zh-cn/BOINC
BOINC是现在最大的分布式计算平台,相当于战网、浩方一样...很多分布式计算项目都使用BOINC平台...当然也有不少项目是使用自己的独立平台的,这就需要去项目主页上看相关介绍...对软件应用不是很熟悉的,还是先学会用BOINC吧...
http://boinc.equn.com/
BOINC的具体使用细则在中国分布式计算总站上有介绍...
尽管BOINC支持在客户端里直接添加项目,不过其实有些项目还是需要先去项目主页注册账号后,才能再在BOINC中登陆后参与项目...

分布式计算项目
http://www.equn.com/index.php/%E5%88%86%E5%B8%83%E5%BC%8F%E8%AE%A1%E7%AE%97%E9%A1%B9%E7%9B%AE%E5%88%97%E8%A1%A8
http://www.equn.com/distributed/active.html
http://cn.boincstats.com/page/project_ranking.php


http://setiathome.berkeley.edu/
SETI@home有很多中国人参与,探索地外文明的...这个对我是最没吸引力的一个项目...


http://boinc.bakerlab.org/rosetta/
http://zh.wikipedia.org/w/index.php?title=Rosetta@home&variant=zh-cn
这就是我第一个参与的项目...我一向对生物医学有兴趣,也觉得这是比较有用的...
这个项目很大程度上侧重于进行提高蛋白质组学方法的精确性和稳固性的基础研究,它也进行一些关于艾滋病疟疾癌症阿兹海默病以及其他疾病的病理学的应用研究。


http://www.worldcommunitygrid.org/
http://www.equn.com/index.php/World_Community_Grid

  • Discovering Dengue Drugs – Together(发现治疗疗登革热的药物 - 齐心协力)
  • FightAIDS@home(对抗艾滋)
  • Help Conquer Cancer(征服癌症)
  • Help Cure Muscular Dystrophy(治疗肌肉萎缩症,目前进行第二阶段
  • Help Fight Childhood Cancer(对抗儿童癌症)
  • Human Proteome Folding(人类蛋白质组折叠,目前进行第二阶段
  • Influenza Antiviral Drug Search(寻找对付流感病毒的药物)
  • Nutritious Rice for the World (全球营养水稻)
  • The Clean Energy Project(清洁能源项目)
    我参加了营养水稻和清洁能源...我觉得这比药物和探索地外文明重要的多...有余力的同学可以参加蛋白质折叠,已经进入第二阶段了...

  • http://folding.stanford.edu/Chinese/Main
    http://zh.wikipedia.org/zh-cn/Folding@home
    http://www.equn.com/index.php/Folding%40home
    这个项目与Rosetta@home类似,不过还是有区别的,Stanford有自己独立的平台...不过他的平台也一直在更新对各种硬件标准的支持...已经明确对NV CUDA的优化,从鸟语介绍看,对ATI Firestream的CAL也有支持,有独显的同学可以跑跑...

    这只是几个比较大的项目而已,看看列表,分布式计算项目还是挺多的,类型也很多,我还是建议大家尽量参与生物医药类项目...

    BOINC是绿色软件,所以可以不安装在系统盘里,安装时数据目录也不要设置在C盘...一开始会选择你想参与的项目,点击列表后,都可以看到网址,可以先看看介绍,选定后会要求注册或登陆...默认的界面是个简单的图形界面,点击右下角的Advanced View就可以进入高级界面,在“高级”-“本地参数设置”里可以设置分配给项目研究用的上传下载带宽、硬盘空间大小、CPU使用率和内存等,其中处理器一栏,“是否在计算机使用时仍运行GPU计算程序”,有独显的同学最好勾上,因为即使平台对CUDA和Firestream没有优化,现在GPU的浮点运算能力也已经大大超越CPU...在多核系统上最多使用,这一栏是对于双核以及多核处理器的设置,设置为100%,则BOINC会调用所有的内核计算,如果你是双核,选择50%,则只有一个核心参与运算...最多使用CPU时间,这个就是占有率分配,一般填50%,不过这个占有率真的是时间,BOINC运算永远会用100%的资源,不过你设置为50%则会看到CPU占有率是1秒100%,下一秒0%,这样的波形图...填100%其实也无所谓,因为BOINC的优先率是最低的,当计算机运行其他大型程序时,不管你设定分配给BOINC多少资源,BOINC都会主动让出资源...如果你划分给项目的硬盘空间太小,有些任务是做不了的,这些会在“消息”中显示...最开始会先下载需要计算的数据,然后才会计算,在“任务”一栏都会显示,“网络传输”显示你正在下载或上传的数据包及速度,“消息”相当于异动报告...在“任务”页面下,单击一个运行中的任务,“命令”-“显示图形”,就会显示现在正在计算任务的图形化视图...很炫的哦...超Lab...
    有时也会出现一些服务器问题,我完成的第一个任务结果就因为Rosetta服务器端更新Mini Application程序而无法上传,不过更新完毕后,就可以上传了...结果上传后并不会马上给你积分,任务状态会显示“等待上报”,因为一个任务往往会发给2、3台计算机作,确保准确率...当确认结果准确后,才算完成任务...任务下载、计算、上传,这些都是程序自动的,完全不用管...有的任务计算量会比较大,如果你的机器配置不是很高,最好不要参加太多的项目,术业有专攻,其实这些分布式计算项目往往都是好几年的周期,你根本不用担心只参加一个项目会没有任务做...
    无论是BOINC还是BOInCstats,积分的更新都是有一定时滞的,并不会在第一时间马上更新...
    大家注册项目账号时,最好在账户设置中看一下自己国籍设置,有些项目的默认是国际,需要手动设定自己的国籍...这样在统计积分时,积分会算在China上...还可以参加Team,中国最大的团队是Team China...当然这些注册资料修改相对参与分布式计算本身是次要的,毕竟这些分国籍分团队的统计,对于大多数参与者是一个激励...
    这是我的stats

    这是Team China的

    我们国家的网民众多,而且计算机资源浪费相当严重,很多配备独显的机器只是在进行简单的文字处理、斗地主、开心网...推广分布式计算可以利用这笔宝贵的资源,尽管中国没有什么项目,但是参与分布式计算项目本身就是在造福人类...这比每天掐表拔别人萝卜要来的有意义的多...看看排名,排在最前面的都是至强处理器,一看就知道是服务器...全球有那么多的电脑,每台计算机只要贡献一点点的浮点运算,汇集起来都是很可观的计算量,这种运算方式,加上巨型计算机,可以加速很多大型研究项目的进程...当显卡进入高耗能时代,我就认为自己可能一辈子都不会买显卡了,分布式计算给了我一个买显卡的理由,当然SCII和DIII也是很重要的理由...
    关于耗能,运行程序必然会带来机器负担,自然也会有能耗的提高...对于大部分的机器来说,尤其是显卡,有的机器空载和25%的负荷,能耗都是一样的,分布式计算可以充分利用这25%...即便因为分布式计算造成能耗,我觉得也比玩游戏要强...关于这方面,的确是个悖论...大家自己斟酌吧...
    在论坛上,可以看到很多中国人会纯粹为了积分而通宵开机...这也是中国人参加国际项目的特点...急功近利,非此即彼,过犹不及...老娘对此只能摊爪儿了...他们完全没有理解分布式计算的要义...
    正如分布式计算FAQ最后一条说的一样:
    CPU在100%运行时耗电量会有所增加,增加的幅度依赖于具体的CPU型号,我们建议您只利用计算机的闲置时间来进行计算,不建议单纯为了计算而开机,这也是分布式计算的初衷。

    留言

    突然见到这篇文章,让我觉得和这里的格调好异类

    • 2009/09/05() 23:52:27 |
    • URL |
    • 8la8la #-
    • [ 编辑 ]

    发表留言


    只对管理者显示

    引用

    引用 URL
    http://giseva.blog126.fc2.com/tb.php/36-be797a5a
    引用此文章(FC2博客用户)

    FC2Ad

    FC2ブログ