网站首页 > 教育论文> 文章内容

美媒:研究人员开发新软件令大数据分析速度快百倍_《参考消息》网站(全文

※发布时间:2017-11-22 13:51:55   ※发布作者:habao   ※出自何处: 

  美媒称,在美国电子计算机协会的系统、程序、语言和应用程序大会上,来自美国麻省理工学院、法国替代能源与原子能委员会、奥多比系统软件公司的研究人员展示了一种能针对稀疏数据编写出优化代码的新系统。与现有的非优化软件包相比,这种代码能将数据分析速度提高100倍。

  据美国每日科学网站10月31日报道,人们生活在大数据时代,但大多数数据却是“稀疏”的。比如,想象一下,一张巨大的图表绘制出了亚马逊网站的所有顾客与所有产品之间的关系,如果用1来表示某个特定顾客购买的每件产品,用0来表示没有购买的产品。那么这张图表上的绝大部分是0。

  对于稀疏数据,分析算做大量0的相加和相乘,而这种计算是无用的。为了避免这种情况,程序员会通过编写定制代码来避开0项,但这种代码十分复杂,通常只适用于少量问题。

  在美国电子计算机协会的系统、程序、语言和应用程序大会上,来自美国麻省理工学院、法国替代能源与原子能委员会、奥多比系统软件公司的研究人员展示了一种能针对稀疏数据编写出优化代码的新系统。

  报道称,与现有的非优化软件包相比,这种代码能将数据分析速度提高100倍。它的性能可与针对特定稀疏数据精心手动优化的代码相媲美,而程序员要做的工作却少得多。

  该系统名为Taco,即“张量代数编译器”的英文缩写。在计算机学术语中,像之前所说的亚马逊网站图表那样的数据结构被称为“矩阵”,而“张量”就像是一种更多纬度的矩阵。

  近年来,张量的数算张量代数对于大数据分析和机器学习都变得至关重要。自爱因斯坦时代以来,它也一直是科学研究的一个主题。

  以往,在处理张量代数时,数学软件会先把张量运算分解成各个组成部分。例如,如果某个运算过程需先把两个张量相乘,然后再与第三个张量相加,那么软件会对前两个张量运行标准的张量乘法程序,保存结果,然后再运行标准的张量加法程序。

  但在大数据时代,这么做却太耗费时间。研究论文第一作者、来自麻省理工学院的弗雷德里克舍尔斯塔德解释说,要完成对大型数据集的高效运算,那么每一组张量运算都需要自己的“内核”,即计算模板。

  计算机学研究人员此前已为机器学习和大数据分析中最常用的一些张量运算编写了内核。但可能用到的内核数量是无限的:例如,用于三个张量相加的内核与用于四个张量相加的内核是不同的。

  许多张量运算需将某个张量中的一项与另一个张量中的一项相乘。如果其中一项是0,那么结果也会是0,而计算大型稀疏矩阵的程序会浪费大量时间来对0进行相加和相乘。

  针对稀疏张量的人工优化代码能识别0项并精简涉及0项的运算。这能大大提高张量运算的速度,但需要程序员完成大量工作。

  例如,针对两个矩阵相乘(矩阵是形式较简单的张量,像图表一样只有两个维度),如果是完全矩阵的话(即其中没有一个项能被省略),可能需要12行代码。但如果是稀疏矩阵的线行甚至更多的代码以被省略的部分。

  报道称,Taco系统能将多出来的所有代码自动合在一起。程序员只需指定一个张量的大小、是完全张量还是稀疏张量以及用于导入数值的文件即可。对于任何特定的两个张量的运算,Taco系统都能绘制出一张分级图,首先表明来自两个张量的哪些配对项0项,然后表明来自每个张量的哪些项是与0配对的。它会把所有的0项对剔除出去。

  针对稀疏数据编写出优化代码的新系统Taco能将数据分析速度提高100倍(美国麻省理工学院网站)

  参考消息网10月29日报道英媒称,技术进步已经让中国经济生机勃勃,并有可能解决该国的一些陈年问题。

  据英国《金融时报》网站10月27日报道,博达克咨询有限公司董事长邓肯克拉克说:“大数据技术的前景以及消费者、企业和对大数据技术的接受度让中国经济获得了全新活力。”

  克拉克认为,中国目前繁荣发展的数字经济与之前鼓励国企“本土创新”截然不同,之前是带头向技术项目进行公共基金投入。

  报道称,他的观点获得了佐证,中国数字经济的繁荣发展使中国成为全球数字经济的中心。麦肯锡全球研究所表示,中国占全球电子商务业务的40%以上,而十年前还占不到1%。中国是移动支付的全球领导者,是美国此类交易额的11倍。中国在共享经济技术方面领先,共享单车和共享汽车市场的规模和增幅让所有其他国家相形见绌。

  报道称,任何质疑这种趋势背后企业能量的人都应该看看下述同样来自麦肯锡全球研究所的数据。全球共有262家“独角兽”企业(即估值在10亿美元以上的初创企业),其中三分之一在中国。这就是数字技术所的经济活力。

  报道称,还希望对大数据进行创新性的应用。一名金融领域的介绍了中国可以通过大数据检查个人行为并对越界者进行处罚。

  报道称,中国人民银行征信中心针对企业也建立了类似系统。该中心通过收集企业的社保缴纳记录、住房公积金缴存情况、所受的处罚和励状况、缴税情况、法庭判决等,以评估其是优质企业还是存在信用风险。

  最近,澎湃新闻报道了一则让不少家长惊掉西瓜的新闻:适逢苏轼先生诞辰980周年,附小开展了一系列致敬苏轼的活动。其中,2012级4班的同学利用假期时间,进行了苏轼为主题的小课题研究。他们拿出了《大数据帮你进一步认识苏轼》、《今人对苏轼的评价和苏轼的影响力》、《行走的苏轼》、《唯美景与美食不可》、《苏轼的朋友圈》、《苏轼的心情曲线》、《苏轼的旅游品牌价值》、《苏轼vs李白》等论文。

  对于有着强烈“起跑线焦虑”的中国家长们来说,看了这些论文,大概才知道真正的起跑线在哪里。这种规范的论文结构、严谨的数理分析、老辣的逻辑思维,固然闪烁着“场外求助”的权重,但不得不说的是,就算是把这些论文抄一遍、看一遍,也够孩子们长不少知识的了。锦上添花的点赞就不说了,酸涩的羡慕嫉妒恨之外,大概还能在“小学生大数据分析苏轼”这则寓言里读到三重现实意义。

  第一,教育资源的差距。六年级的孩子在干吗?这个问题的现实答案就是——大概更多的中国孩子还在毕业班的压力下如陀螺般旋转着。他们在忙着考试,他们在忙着上班,他们连画画钢琴课都不上了,哪里还有大把时间来玩“论文”?

  那么问题就来了,附小的毕业班学生为什么有这个精力和情趣?答曰,学校教育使然,地区教育使然。坦白说,更多基层老师不是不明白“研究性学习”的美好,但问题是,在闭环链条的教育下,师生多身不由己,哪里还能有这样的闲情逸致?校校泯然于众,还有谁愿意做“附小”呢?这大概是个典型的囚徒困境,越是教育欠发达地区,越是在分数和应试上,最后的结果是榨干孩子的每一滴油,徒留下一个只会学习的脑子。

  第二,代际资源的差距。附小是所什么学校?这个问题,大概人皆知。这所学校学生的父母,大概也多是精英阶层序列里的。坦白说,你只要看看这些小学生逆天的论文题目,大概就能估算出其家庭教育的分量和层级。这些论文,仅就选题来说,不谈早就超越了小学语文老师的“能力范围”,估计就算放在中国社科学界,也不算拿不出手。

  孩子在论文里也写得很清楚,“我和爸爸一起”,“在爸爸的帮助下”。建立模型、数理分析、逻辑推演……这些论文早已超越了一般中国家长参与家庭作业的水平。很显然,这不是做个南瓜灯、出个手抄报那么简单,的是扎扎实实的专业知识素养和科研能力。有人说,这是拼爹。这个帽子有点大,承认代际资源的差距,这是正确面对人生的第一步。精英阶层有家教优势,怕只怕有优势的还肯花时间、还懂得用心,就像“富二代还比你拼”一样,这就不是代际固化所能娇嗔的了。

  此外,它还展示了“家庭作业”的差距。这些年,中国义务教育阶段的家庭作业是个叫人倍感纠结的话题:一方面,家庭作业异化成了家长作业。教师只布置不检查、又或者乱布置瞎检查,害得家长。甚至不少地方教育部门要求家庭作业回归“学生与教师”本位。另一方面,在家庭教育越发被重视的今天,学校及老师也未必知长参与的边界在哪里。于是结果就两个,要么瞎让家长参与,要么不让家长参与。类似“苏轼课题”这样的论文,恐怕才值得亲子之间好好协作,而有些基础作业,恐怕还是不要家长代劳为好。

  朱熹在《小学》里有言,“习与智长,化与心成。”教育之于孩子的濡染效用,不是一篇论文能以实现的,却又在点滴之间悄然生成。我们既欣赏于附小的“放得开”、赞叹于学生家长的“费心思”——更均衡优质教育资源,让更多基层学校见贤思齐;亦盼望家长在艳羡别人家孩子论文的同时,对真正的素质教育多些包容、激赏之情。

  贵阳9月30日电(记者施钱贵)记者30日从相关部门了解到,贵州省为一些地区的留守儿童、困境儿童配发安全手环,利用大数据来给这些孩子“保驾护航”。

  据贵州省民政厅副厅长刘忠平介绍,贵州省毕节市、黔西南州投入资金近2400万元,为10万余名小学阶段留守儿童配发安全手环,实现儿童信息与机关报警平台和天网工程无缝对接。“这些措施,进一步夯实了留守儿童困境儿童关爱救助工作的基础。”他说。

  毕节市黔西县依托“互联网+”大数据平台的管理,为义务教育小学阶段的留守儿童佩戴安全手环,并与县天网数据资源共享,实现对留守儿童无盲区、全覆盖。黔西县副县长曾科表示,该县8533名义务教育小学阶段的农村留守儿童中,已完成8124人安全手环佩戴工作,而657名小学阶段困境儿童已全部佩戴安全手环。

  同样,六盘水市水城县开发了由县级总调度、乡(镇、街道)监管、村(居)动态管理的留守儿童工作大数据平台。该平台具备信息不全提醒、GPS定位、自动生成报表等功能,实现了信息采集规范化、动态管理适时化、问题监管智能化,提高了工作效率。

  参考消息网9月20日报道外媒称,骑行运动目前正处于快速发展的阶段,是一项颇受欢迎的运动项目。自行车运动必须学会利用数字时代提供的各种机遇,以便吸引新的品牌赞助这项运动。

  据西班牙《发展报》报道,尼尔森公司调研报告显示,自从2013年以来,法国对自行车运动的兴趣从34%增长到40%;意大利从40%增长到43%;西班牙从44%增长到46%。

  随着受欢迎程度不断攀升,吸引更多赞助商成为自行车运动可持续发展的当务之急。西班牙营销协会为此发起一项网络营销活动,旨在为自行车运动发展寻求更多支持。此项活动指出,必须抓住两个关键因素才能吸引赞助商,其一是新技术时代带来的机遇,其二是自行车运动在普通中的受欢迎程度,这一程度同样体现在自行车节目的收视率上。

  报道称,技术挑战存在于三个方面。首先,要了解普通为何参与自行车运动,因此大数据分析十分重要。其次,在了解第一点之后,应当对这些数据展开进一步分析,为普通提供一项视听服务,并通过这项服务向其自行车运动的内涵。第三,通过现有的所有平台提供这项视听服务,同时不断加深其专业性。

  目前大数据分析仅限于提高运动员的竞技水平。或许在不久的将来,大数据分析有望被不同的运动队、和体育赛事组织者利用,以便通过添加新鲜数据,丰富运动节目的内容。

  专家认为,在各个平台诸如某位自行车选手在车迷的鼓励下冲过终点线的镜头,非常有助于拉近自行车运动与普通之间的关系。而要实现这一点,在大数据分析的基础上提供视听服务就成为最佳方式。

  西班牙自行车联合会何塞易斯洛佩斯塞龙表示,希望全世界能有越来越多的普通人热爱自行车运动并喜爱观看自行车赛事。该机构致力于让更多人认识到,自行车不仅是一种交通工具,更是一种生活方式和娱乐方式。

  比起其他体育项目,自行车运动具有特殊性,例如户外赛事很少有门票收入,不在固定场地内展开,对运动员的安全构成一定风险等。这些特点对组织者和赞助商都构成挑战,但与此同时也带来了机遇。

  专家指出,虽然自行车赛事是一项任何人都可以在口观看的赛事,但是如果不在口举行,很少有人愿意千里迢迢来观看比赛,于是很多衍生的比赛收入都无法实现。但是组织者可以通过租用大巴车等方式将观众带到比赛现场,并为他们提供与运动员谈话交流的机会。

  在吸引到赞助商之后,最重要的争取签订一份长达数年的稳定协议。在获得稳定赞助之后,运动队伍才能吸引到更加优秀的运动员,并配备更加先进的设施。(编译/菲)

  参考消息网8月18日报道港媒称,全球最大数据中心将落户北极圈北部一座偏远小镇。这处名为科洛斯的设施正由同样名为科洛斯的美国和挪威合资企业开发。这家公司说,这座中心需要的用电功率最终将达到创纪录的1000兆瓦。

  《南华早报》网站8月16日报道,科洛斯在公司网站上称,挪威巴朗恩的寒冷气候和水电资源将帮助削减60%的能源成本。这家公司还说,科洛斯将成为“数据堡垒”。

  这家公司说,这座中心将直接创造2000至3000个新的工作岗位,并带动该地区新增1万至1.5万个工作岗位。

  斯堪的纳维亚半岛对大型数据中心并不陌生,脸书公司的数据中心就坐落在,距科洛斯数据中心约386公里。

  在开发人员期望能够利用量子技术的强大力量之际,计算机据认为正处在的边缘。量子计算机的一大吸引力是其能同时就多个不同的可能性进行计算。

  亚马逊机器学习科学项目负责人拉尔夫赫布里希周二说,谷歌可能会在今年宣布研发出能够取代现有技术的计算机。

  赫布里希说:“那么这对商业领域来说意味着什么?影响其实很大。你让人们拥有了强大得多的运算能力,这会影响金融业、商业和安全领域。比如说,你能利用这些技术来破解加密内容。”

  他还说:“但是届时,这也会带来另一个问题,那就是和会如何看待这种无人能够侵入的绝对安全的通信系统。”

  赫布里希说,数据中心可能会成为量子技术发展的关键,因为用户期望能够通过云端获得这种新的计算机能力。

  推荐: