老兵帅客 发表于 2016-6-20 21:04
这个申威SW26010貌似用的是以前DEC的Alpha 21164那套,那么软件可用性如何就是个问题了。
现在的主流操作 ...
谜团 发表于 2016-6-20 08:18
把unix/linux改改肯定不是什么大问题
老兵帅客 发表于 2016-6-20 21:29
改人家的开源操作系统可能不是大问题,那些本机码应用才是大问题。没有什么应用程序可用的机器只是个展品 ...
谜团 发表于 2016-6-20 21:45
操作系统接口兼容unix/linux 应用就没什么好担心的了 跑java vm不是啥困难的事 ...
老兵帅客 发表于 2016-6-20 21:04
这个申威SW26010貌似用的是以前DEC的Alpha 21164那套,那么软件可用性如何就是个问题了。
现在的主流操作 ...
老兵帅客 发表于 2016-6-20 21:04
这个申威SW26010貌似用的是以前DEC的Alpha 21164那套,那么软件可用性如何就是个问题了。
现在的主流操作 ...
谜团 发表于 2016-6-20 08:45
操作系统接口兼容unix/linux 应用就没什么好担心的了 跑java vm不是啥困难的事 ...
江城如画里 发表于 2016-6-20 08:48
系统是江南所自己开发的Linux,没软件怎么跑LINPACK啊……
谜团 发表于 2016-6-20 08:47
就怕有领导要独立自主 弄个自成一体的奇葩系统
江城如画里 发表于 2016-6-20 08:51
操作系统的名字是RaiseOS,实际就是linux,为自己的硬件定制linux在国内不是什么高科技的东西。5,6年前 ...
这块芯片好神秘
网上查不到相关资料
只有一篇报道,说它是基于alpha的21164指令集
而单芯片260核,一般我们都把它归类为many core,众核
一般超过单芯片32核以上就算众核了
我以前只知道有家小公司叫TILERA的做过这样的芯片,大约是五年前,做到100核,技术源出MIT
曾经跟这家公司的CTO CEO接触过
这种芯片的难点在于把各个核连接起来的总线。。。
这次用了这么古老的一个指令集,用了这么奇葩的一个架构。。。真有点出人意料了
这次江南所放了个大卫星啊
我查到这块CPU的资料了
田纳西大学计算机系有篇文章详细介绍了,基于Alpha 21164指令集,64位
这种超算系统大多是用intel 通用CPU+phi芯片搭建的
通用芯片管运算调度,phi芯片管向量运算
各管各的
我说这次放卫星
首先,这块芯片采用master slave核结构
一个通用master core带64个向量core作为一组,然后四组直接做在一块SOC芯片里
intel的方案是分两种芯片,分开搭系统,然后拼起来
它是直接把两种芯片做在一个die里。。。
它没有用任何intel的芯片和指令集
用的是alpha的指令集,不过我不知道江南所是怎么从HP手里拿到alpha的指令集授权的
SOC只是其一
其二,它的slave core通信总线架构跟intel phi芯片完全不同,intel是一个ring 总线
它的架构跟我说过的那个tilera非常像。。。。
8*8的一个矩阵
我感觉江南所这几年一定是得到了业内高水平人员的加盟
这架构相当先进,完全秒杀intel商用芯片方案
intel之所以分成两种芯片分开做,完全是因为公司政治斗争
通用芯片是美帝本土那帮人在做,而phi芯片是以色列的团队在搞
intel这么多年无法整个成一个SOC对外提供解决方案。。。。
问:据说这次的超算架构很难编程?这种CPU有没有可能搭建出来一套类似IBM小型机的产品出来?
答: 不难,通用架构,他们自己提供了C/C++编译器
这种芯片其实是一种定制ASIC芯片
专用的SOC
因为有通用的core,你可以把它当成普通的服务器用
只不过浪费了它强大的向量计算功能
老兵帅客 发表于 2016-6-20 21:54
实际应用可不仅仅是LINPACK那点玩意儿。对应的例子,一直有人想在unix/linux上跑windows应用,也有对应的 ...
老兵帅客 发表于 2016-6-20 21:55
结果就是宣传上的胜利,实际上没用。
也许我不了解这个领域的软件特点,也许那上面的软件都是各自从头开 ...
江城如画里 发表于 2016-6-20 09:00
老兵可能对超算相关软件不是特别熟悉,这多数是开源的,所以关键在于把gcc/llvm跑通,只要有全套编译环境 ...
老兵帅客 发表于 2016-6-20 21:04
这个申威SW26010貌似用的是以前DEC的Alpha 21164那套,那么软件可用性如何就是个问题了。
现在的主流操作 ...
老兵帅客 发表于 2016-6-20 22:05
也就是说,必须有全套源代码。假使这点成立的话,少数民族问题就不是个问题了。
另外,巨大物理机器里面 ...
老兵帅客 发表于 2016-6-20 21:04
这个申威SW26010貌似用的是以前DEC的Alpha 21164那套,那么软件可用性如何就是个问题了。
现在的主流操作 ...
穿着裤衩裸奔 发表于 2016-6-20 09:16
算你敢说,我都没感冒泡
老兵帅客 发表于 2016-6-20 22:05
也就是说,必须有全套源代码。假使这点成立的话,少数民族问题就不是个问题了。
另外,巨大物理机器里面 ...
穿着裤衩裸奔 发表于 2016-6-20 22:36
他这个超算本质上还是要手写算法,这部分不能和通用处理器比较。intel的志强是Numa架构,每个处理器有自 ...
题外话,其实我不大看好超算得前景 … …
穿着裤衩裸奔 发表于 2016-6-20 22:36
他这个超算本质上还是要手写算法,这部分不能和通用处理器比较。intel的志强是Numa架构,每个处理器有自 ...
老兵帅客 发表于 2016-6-20 09:05
也就是说,必须有全套源代码。假使这点成立的话,少数民族问题就不是个问题了。
另外,巨大物理机器里面 ...
赫然 发表于 2016-6-20 10:39
我的理解是,这种超算主要是用来进行大规模数学计算的,主要是气象,理论物理,还有军工。这些软件都只能 ...
沉宝 发表于 2016-6-20 23:26
集群因为网络时延,对紧耦合的问题还是不行吧?除非算法上有突破
穿着裤衩裸奔 发表于 2016-6-21 00:04
要看工作集的大小了。但我觉得超算应该是松耦合,否则规模难上去。
其实用PCI express 非透明桥做紧耦合 ...
猪头大将 发表于 2016-6-20 22:00
我认识的一位华为工程师的点评和问答。
沉宝 发表于 2016-6-21 02:12
我说的意思是紧耦合问题(比如空气动力、核物理等)对芯到芯之间的时延非常敏感,时延到一定程度后再添多少 ...
老兵帅客 发表于 2016-6-20 21:57
定制不难,难的是上面有能用的应用。
别的不说,windows nt开始的现代windows,经历过的硬件平台有多少 ...
leekai 发表于 2016-6-20 21:16
这也是几个国产CPU之一
穿着裤衩裸奔 发表于 2016-6-21 07:31
规模上去后延时解决不了。延时本质上是光速限制。现在常见的商业服务器几个处理器之间距离只有大概10厘米 ...
沉宝 发表于 2016-6-20 23:26
集群因为网络时延,对紧耦合的问题还是不行吧?除非算法上有突破
看客 发表于 2016-6-21 08:55
时延的问题,裸奔说的infiniband就是解决这个的,infiniband是RDMA的方案之一。
超算和集群同属并行计算 ...
江城如画里 发表于 2016-6-21 08:54
这证明了集群的思路不如超算了吧。太湖之光,单个SOC是260个核,单卡是2个芯片,单节点4张卡,共 ...
江城如画里 发表于 2016-6-21 09:05
争论超算和集群,我觉得有点像争论内存大了是不是硬盘就没用了,这两个用途不一样。但就目前来说,SOC内 ...
穿着裤衩裸奔 发表于 2016-6-21 09:20
Infiniband都用上了,还说什么紧耦合呢。
200多个核一个soc, 核有多大面积可想而知。cache本质上就是静态 ...
看客 发表于 2016-6-21 09:33
只是解释沉宝的问题,没想争什么。
分布式集群与超算应用方向和范围不同,不完全可比。像各互联网公司提 ...
江城如画里 发表于 2016-6-21 09:41
好好好,没意义没意义。您用USB3.0+INTEL的CPU+Nvidia分分钟秒掉这个93petaflop/s的超 ...
穿着裤衩裸奔 发表于 2016-6-21 09:50
好啊,不多要,就20亿人民币,你一个人出
老兵帅客 发表于 2016-6-20 22:05
也就是说,必须有全套源代码。假使这点成立的话,少数民族问题就不是个问题了。
另外,巨大物理机器里面 ...
老马丁 发表于 2016-6-20 20:54
top 500, 中国有167台,美国165台,算下来其他国家168台。中国还差其他国家一截,要继续努力。 ...
江城如画里 发表于 2016-6-21 10:05
行,真来20亿人民币您做不出来怎么说啊,不需要您真的分分钟做出来,2018年美国能源部计划要上更牛 ...
江城如画里 发表于 2016-6-21 10:59
不跟@穿着裤衩裸奔 兄弟逗乐了,呵呵。说点正经的吧。
这个太湖之光的好处,可能最大的意义在于,告诉美国 ...
穿着裤衩裸奔 发表于 2016-6-21 11:07
你还真把超算当火星科技了?
超算这个行当式微就是因为没需求。那个infiniband也不是啥先进技术,都出来1 ...
穿着裤衩裸奔 发表于 2016-6-21 11:19
兄弟你误会了,我不是说你这个超算没技术含量,或者没意义。我是觉得集群比超算更有前途,而且超过超算并 ...
江城如画里 发表于 2016-6-21 11:32
嗯,这个讨论我觉得挺有意义的。我的看法是这样的,目前各大云计算厂家,都已经开始在能耗问题碰墙了。ID ...
江城如画里 发表于 2016-6-21 11:32
嗯,这个讨论我觉得挺有意义的。我的看法是这样的,目前各大云计算厂家,都已经开始在能耗问题碰墙了。ID ...
穿着裤衩裸奔 发表于 2016-6-21 11:49
说穿了这个是如何在软件和硬件之间分解设计的问题,假如说半导体技术撞墙,那要多核加手工优化算法,否则 ...
看客 发表于 2016-6-21 11:57
云计算这样的集群,主要是要应对并发,并行倒在其次。这方面是集群应用不同于超算的地方。所以集群的电费 ...
江城如画里 发表于 2016-6-21 12:05
这个我还是不太同意。您说美国能源成本低,但是目前云计算厂家,google/aws,都在打降低能耗的主意,诸如 ...
猫元帅 发表于 2016-6-20 19:21
首先可以说“超级计算机再多有什么用,也不能让山区的孩子吃上一顿有尊严的午餐”
其次可以说“劳民伤财, ...
穿着裤衩裸奔 发表于 2016-6-21 12:17
傻快和节约能耗不矛盾。cpu最大的敌人是温度,要快只能降温,也就是节能。
直到今天,号称节能的arm和int ...
穿着裤衩裸奔 发表于 2016-6-21 12:17
傻快和节约能耗不矛盾。cpu最大的敌人是温度,要快只能降温,也就是节能。
直到今天,号称节能的arm和int ...
江城如画里 发表于 2016-6-21 12:21
呃,我说的是DeepMind,没说AlphaGo,AlphaGo目前确实用的是英伟达的GPU。你查下TPU,Tensor Processing ...
穿着裤衩裸奔 发表于 2016-6-21 12:17
傻快和节约能耗不矛盾。cpu最大的敌人是温度,要快只能降温,也就是节能。
直到今天,号称节能的arm和int ...
猫元帅 发表于 2016-6-20 19:21
首先可以说“超级计算机再多有什么用,也不能让山区的孩子吃上一顿有尊严的午餐”
其次可以说“劳民伤财, ...
江城如画里 发表于 2016-6-21 12:28
呃,关于资本力量,我本人就是做技术型投资的,这个我感觉更有发言权。至少在投资界没人认为超算是黑洞型 ...
穿着裤衩裸奔 发表于 2016-6-21 12:45
你们不觉得超算是黑洞项目是因为国家买单,实际上我是被迫出了份子钱。。。。。而已。。
中国政府 ...
穿着裤衩裸奔 发表于 2016-6-21 12:45
你们不觉得超算是黑洞项目是因为国家买单,实际上我是被迫出了份子钱。。。。。而已。。
中国政府 ...
江城如画里 发表于 2016-6-21 12:53
,顺便说下,华为在超算方面投入也不小……
谜团 发表于 2016-6-21 13:01
不扭曲能30年走别人几百年的路
梓童 发表于 2016-6-21 12:32
再加一个吧:中国167台,外国333台,中国就是外国的一半,外国完胜。
穿着裤衩裸奔 发表于 2016-6-21 13:09
这还真不是扭曲搞出来的。恰恰是放手的结果。
谜团 发表于 2016-6-21 13:55
核心产业没几个是放手的
穿着裤衩裸奔 发表于 2016-6-21 14:07
所以发展的最慢,做的最烂
谜团 发表于 2016-6-21 14:10
你让其他国家怎么活呀 航天 航空 高铁 电力 核电 造船。。。
穿着裤衩裸奔 发表于 2016-6-21 14:13
那不关我事了。。。。可以为奴,不嫌多。
谜团 发表于 2016-6-21 14:18
成就大小 和关不关你事啥关系
穿着裤衩裸奔 发表于 2016-6-21 12:45
你们不觉得超算是黑洞项目是因为国家买单,实际上我是被迫出了份子钱。。。。。而已。。
中国政府 ...
大黑蚊子 发表于 2016-6-21 15:52
这个有失偏颇,华为在松山湖的地不是现在才弄的,5年前就已经谈妥了相关合作。
5年前东莞的房价才多少? ...
穿着裤衩裸奔 发表于 2016-6-21 16:12
但实际拍卖是15年12月,按照拍卖时间算是15年了
相比于机器本身,更值得期待是年底的Gordon Bell奖,这个ACM的Award是颁发给HPC领域的最前沿的应用的,代表着具体系统和实际应用结合的最高水平。中国目前还从未获得过,连入围最终阶段的应用都还没有(去年有个德国的应用在天河2上入围了)。而今年,在神威太湖之光上有2个应用(也有可能是3个)已经入围了11月份的Gordon Bell奖最终评审阶段,如果能够斩获最终的大奖,意义更大。
作为前HPC从业只能说江南所很强,用落后两代的工艺造出跟英特尔下代众核相当的产品,还比英特尔先投入应用
看到楼下貌似喷子回复出现,特此针对喷点补充一下:
1)中国无论天河-1还是天河-2现在都是满负荷运转,根本没有闲置问题,天河1不说了,现在用得排队,天河2的国防科大自己想测试下节点都经常没资源,所谓天河-2上利用效率不高也是相对于去目的的,把资源满负荷当然容易,以前跟袁学峰教授合作过,这么说吧,人家所谓利用不充分是说重大科研课题放在天河-2上的没他们期望的比例高,至于金融类动漫类低层次的应用,人家根本没把它们当正经应用(这类应用由于门槛低,并行度高,很容易占用大量计算资源),国防科大和广州天河的袁教授期望的是天河-2在国家重大专项等高层次应用上更多做出贡献,比如核物理,流体力学等代表超算顶尖水平的应用更多(这也是天河-3继续获得国家拨款的主要依据,国家一点都不傻),这当然有一定难度,因为天河-2是异构计算机,想充分利用这些资源,代码几乎都得重写,实际上,在美国TITAN上由于用了GPU, 这类应用推进的也不怎么样。
2)以我在HPC工作接触的情况来看,江南所这个超算完全不用担心上述问题,因为江南所是军方背景,他们搞得计算机一个主要应用就是核物理仿真,中国在核物理仿真方面几乎全部代码都是自主搞得,而且很多代码都是针对江南所的计算硬件专门设计的,编译器加速库等生态系统一应俱全,因此这些在天河-2上遇到的问题,反而在神威上可能不是太大问题,一个例子就是神威超算刚上线,一个核物理仿真在神威上就取得了40P的惊人效率,并且已经入围超算应用国际大奖评选了(效率3占到理论峰值多30%的超算应用是惊人的,实际上写过程序的都知道,别说超算,即便多核计算机,一般的应用能达到系统浮点峰值30%都是挺不错了)。
当然相应的,神威上部署民用应用,比如金融/动漫渲染之类低层次应用,反而难度会大一些,基本上代码得重写或者大改,但是对这种层次的超算,这些低水平应用本来就不是重点。
懒厨 发表于 2016-6-21 19:15
请问这个可以用来挖矿挣比特币吗?
江城如画里 发表于 2016-6-21 21:00
可以啊,无锡超算中心还没开放,可以去广州超算中心申请
http://www.nscc-gz.cn/Service/Iwanttovisit.ht ...
natasa 发表于 2016-6-21 21:36
附近有一个深圳超算,这家的机器很旧吗?
财迷心窍 发表于 2016-6-21 04:24
知乎上看到的。
这个Gordon Bell奖是啥?
穿着裤衩裸奔 发表于 2016-6-20 23:28
那下一步要看intel升级工艺的速度了。号称5nm是墙,估计再过5年就看到了。 ...
冰蚁 发表于 2016-6-22 09:44
5nm 的 prototype已经出来了。量产的话,7nm就够呛了。5nm 太 crazy 。
穿着裤衩裸奔 发表于 2016-6-21 21:19
这个俺就不懂了。Intel最近这次制程升级后有一阵良率就不行,交不上货。
现在做处理器的基本上都是fables ...
冰蚁 发表于 2016-6-22 10:41
Intel 14nm 量产上是遇到过困难。不过 intel 只给自己生产,不是一个 foundry。intel 一直无法进入移动领 ...
穿着裤衩裸奔 发表于 2016-6-21 21:50
这次intel的tablet处理器应该是死在软件上。
android没优化好,连打电话都不行。 ...
大黑蚊子 发表于 2016-6-21 17:04
哦,你说的是去年华为拿的那几块地
那几块地是限价房,是作为将来人才公寓使用的,有点儿类似深圳的高级 ...
料理鼠王 发表于 2016-6-22 19:41
华为几年前,将终端总部搬到东莞,这几年GDP可是蹭蹭往上提。
所以东莞市政府和华为才更有信心开始第二期 ...
江城如画里 发表于 2016-6-21 21:00
可以啊,无锡超算中心还没开放,可以去广州超算中心申请
http://www.nscc-gz.cn/Service/Iwanttovisit.ht ...
料理鼠王 发表于 2016-6-22 19:41
华为几年前,将终端总部搬到东莞,这几年GDP可是蹭蹭往上提。
所以东莞市政府和华为才更有信心开始第二期 ...
欢迎光临 爱吱声 (http://aswetalk.net/bbs/) | Powered by Discuz! X3.2 |