大数据是件大事

阿曼达·加里博士,“04

地球

你今天的上班路线。转发一次总统辩论。洗碗机运行在7点。由于传感器的融合,全球定位系统(GPS),数字通信,无线连接,他们现在都是潜在的数据点。行为转换为字节的数据反映出的关于自然世界的信息,识别的个人独特的基因突变的化学身份在平流层高空的微小粒子。欢迎来到大数据的时代,被誉为显微镜的革命性突破。CALS的研究人员是收获一种新的收获从大数据,开发工具来对抗疾病,减缓气候变化,获得新的见解的动态人类沟通和商务的未来。

Aija Leiponen
“经济会意识到这些数据的价值,但特殊的数据作为一个产品是什么?这不是分隔,版权;这是一个无形的好,可以在同一timean中间和最终产品。我们还没有足够的数据对大数据组织巨大的研发机会。”

-AIJA LEIPONEN,
副教授查尔斯·h·戴森学院应用经济学和管理bob电竞在哪里打开
照片:罗宾Wishna

大企业

作为专家在技术变革,数字业务策略和业务创新的过程中,Aija Leiponen一直急切地跟踪大数据商业的崛起。她之前的研究表明,利用信息从大学研究的广度和消费者供应商和竞争者的前身公司的创新。大数据戏剧性的变化对企业和消费者的承诺。

“我们确实观察数据爆炸Leiponen说,副教授查尔斯·h·戴森学院应用经济学和管理。bob电竞在哪里打开”例如,大数据是由物联网,在传感器嵌入在对象传递信息通过互联网。它是廉价的无线连接产品与转发器或可读标签,所以制片人可以知道一切,提供了一个非常详细的视图供应链。”

大数据已经改变做生意几十年的模式,即使是在每小时300英里,27000英尺的空中。

等传感器,取得了“巨大飞跃,一些飞机引擎实时无线中继性能数据在特定的飞机制造商,”她说。“这是改变业务模式的一部分:而不是购买发动机,飞机制造商可以按小时支付使用。”

这种“servitization”基于数据通过通信网络正蔓延到无数的行业。Leiponen预测,不会过多久使用大数据的方式向消费者更加明显。越来越大的宽带信息管道和无线技术连接对象的业务开展的影响可能出现在电网。

“智能电表在家里会让你知道电器使用时,允许公司管理需求作为能源使用的传感器传递一个动态图片,Leiponen说。”,可以被纳入现货价格提供给家庭。”

一个新的发展是数据本身成为一个资源与经济价值,特别是关于人类行为的数据,从所有的采购和其他可追踪行为。虽然很多公司认为这些信息是重要的,为不同的池定义货币价值的行为数据,以及规则的适当使用仍然具有挑战性。

“经济会意识到这些数据的价值,但特殊的数据作为一个产品是什么?这不是分隔,版权;这是一个无形的好,可以在同一时间一个中间和最终产品,”Leiponen说。“我们还没有足够的数据对大数据组织巨大的研发机会。”

在这种情况下,规定玩赶上经济。数据经纪人已经找到新的方法来利用消费者行为数据。Leiponen指出,联邦贸易委员会审查的几个已经寻求收集信息收集,如何使用它,以及消费者是否有能力访问和正确的信息或选择退出他们的个人信息出售。

“大哥哥和大数据齐头并进,“Leiponen说。“消费者出售廉价的数据,对公司本质上提供有价值的数据。”

#移情

Margolin画
”你可以看到实时的原始表达情感,
在全国范围内的洪水和国家媒体的关注
陷害事件。我们的分析表明,
直接表达的恐惧也直接关系到后续的表达团结。”

MARGOLIN画,
通信助理教授
照片:罗宾Wishna

准确实时的机会,真实世界的观察人类行为,鼓励沟通了助理教授Margolin转向Twitter研究discourse-who说话的形状,谁与谁,他们说什么?微博提供一些真正的优势更传统的实验方法,调查和无菌室可以自我意识。

“最主要的不同是细粒度的行为数据的能力,”他说。“你无法获得人民的思想,但你看到这么多的行为在现实世界中。”

这种观察通讯的能力在一个“自然栖息地”——也许一个舒适的椅子上窝在电视机前Margolin与手诱人的电话。他研究了一个领域是政治话语,高音面临的选择之间的模仿和对抗。

看微博在总统竞选辩论期间,他发现她转发的精英取代用户更典型的交互,网整体下降的不同的声音和质量交换。

Twitter数据的另一个优点是能够跟踪新兴思想应对意外事件,从自然灾害到恐怖袭击,实时。

“你不能模拟诸如恐怖袭击。独特的未预料到的情况下,人类行为,没准备和记忆是非常不可靠的,”但Margolin说。“例如,要求你能打电话如果你参与恐怖袭击是不同的比你实际的电话。”

让他看到人类倾向在海里的数据:情绪如恐惧、悲伤和同情。例如,Twitter数据在2013年波士顿马拉松爆炸后- 180总tweets-showed活动更大的人我们可以推断出有强烈的连接到实体上定位他们的微博。另一个例子是一个校园枪击案在佛罗里达,人在一个位置也经历了枪击事件推他们的支持,这样的消息“我们…我们觉得声援你。”

”你可以看到实时的原始表达情感,在全国范围内的关注洪水和国家媒体框架,“Margolin说。“我们的分析表明,恐惧的直接表达式也直接关系到后续的表达团结。”

急救的实用目的或政府机构寻求减少或消除恐惧在邻近的人群在恐怖袭击之后,他的研究结果表明,恐惧将扩散到这些社区最相似的个人经历了从一个社区相关事件可能带来共鸣,但这也意味着最可怕的时刻,重温。

海原余
“网络的拓扑结构可以告诉你很多关于系统的生物学。就像航空枢纽,有proteins-a非常小的分数是消息灵通,对网络的鲁棒性和弹性面对故障。”

小玉,
生物统计的助理教授
和计算生物学
照片:罗宾Wishna

利用拓扑

能够查看整个网络优势,社会和自然科学都接受。海原Yu的网络,生物统计和计算生物学助理教授,研究不是点对点;它们是蛋白质蛋白质。映射创建的网络相互作用蛋白在酵母他研究和20000年- 5000年在人类理解的关键,诊断和治疗疾病,包括癌症和肌肉萎缩症。

“所有的蛋白质在细胞中,没有单独行动,”Yu说。“整个细胞连接的“六度分离”。“

他的方法是测试每个蛋白质的相互作用与其他实验室,然后构建网络。映射作为网络的相互作用可以产生见解没有如果他们看个人对蛋白质,因为网络的连通性可以透露关键信息。

“网络的拓扑结构可以告诉你很多关于系统的生物学,”Yu说。“就像航空枢纽,有proteins-a很小的一部分——[,]消息灵通,对网络的鲁棒性和弹性面对故障。”

虽然可以将蛋白质网络健壮的基因的随机错误,另一方面是他们更脆弱,面对目标类似细胞的恐怖主义行为目标网络中心。了解蛋白质的位置在网络帮助于理解其潜在的影响和预测能力,例如在药物的副作用。

“大约20%的药物候选人在早期临床试验失败由于安全问题引起的副作用,”Yu说。“理解和预测是什么原因导致的副作用是至关重要的对人类健康和医药行业。”

Yu的实验室观察蛋白质药物的目标框架的人类蛋白质interactome网络,网络的物理相互作用的分子。他们发现,重要的不是药物的总数的目标,但这基本targets-proteins数量中心networks-determined其副作用的发生。研究结果将揭示新的因素纳入药物开发管道。

他们刚刚完成了一个项目映射interactome网络对裂殖酵母,Yu称其为一个“被遗忘的生物体,”有很多途径等基本过程与人类共同的基因是如何关闭。所有5000个裂殖酵母蛋白质测试彼此交互和三replicates-using蛮力在实验室在三years-yielding 7500万对前瞻性分析。余的实验室能够互动的身份约2300。大数据允许于发现他的那些针在干草堆。

使用大数据的方法使他们发现几个小说因素参与前所未知的基因调控。

“这真的突出大数据中发现的作用。当你看整个系统你不要错过的东西,”他说。“我感觉非常幸运做生物学吧。”

托比奥尔特
“这是真正令人兴奋的我,自然之间的相互作用
变化和人类活动。它非常适用。农民和
种植者并不真的在乎天气2100年,但是当
植物在一个特定的弹簧,具有重要的社会意义。”

托比奥尔特,地球和大气科学助理教授

解析预测

当气候科学家使用大数据来研究整个系统,它包括植物、土壤水分、生物地球化学、海洋和大气。这就是为什么,当涉及到大数据的绝对规模,目前CALS的炫耀与大气科学家。

“大数据就是大气科学家一直叫‘数据’,”托比奥尔特解释说,地球和大气科学助理教授。“我们的能力来生成数据可以超过我们解释结果的能力。大数据可以是一个大混乱。”

奥尔特与测量的数据petabyte-one百万gigabytes-using最大的公共访问全球气候模拟研究科学数据库生成。了解气候建模,奥尔特建议想象一个很好的游戏,水流看起来像真正的水,因为游戏是建立在物理运动和能量交换。

它还依赖于实时,非常详细收集的数据通过卫星。全球气候模型,他使用一个网格的集合网站扩展像一列从地面到上层大气,在时间点频繁每20分钟,多年来收集的。

“本质上,该模型捕获整个系统在地球上更好地对气候变化作出预测,根据最乐观或悲观的假设对于缓解策略的采用,”奥尔特说。“例如,如果你想模拟未来某一特定时期,气候模型允许您比较和对比会发生什么和没有大气二氧化碳的增加。”

他的分析导致了一些可怕的几率为美国西南部和大平原。由于全球变暖,西南地区十年久旱的可能性至少是50%。此外,的机会“megadrought”,持续了30多年,非常高在本世纪末之前在这两个方面,除非大幅降低温室气体排放在接下来的十年。

今天,奥尔特吸引预测时间从10天在未来十年和减轻气候变化的影响在农民的生计。例如,小波动在春天的开始可以有重大影响的时间种植玉米或潜在的损害树果实由于早期霜新兴花蕾和花朵的危险。奥尔特早期的模型预测,弹簧和初秋霜冻将增加在未来几十年,表明农民需要天气预报工具和植物品种适应新的标准。

——“这是非常激动人心的自然变化和人类活动之间的相互作用。它非常适用,”他说。“农民和种植者不真正关心天气2100年,但是当种植在一个特定的春天,这具有重要的社会意义。”

大数据,小颗粒

萨拉·c·普赖尔的工作,地球和大气科学教授,重点理解气候变化的原因和变化为了做出更好的预测未来的区域和当地的气候。

“气溶胶粒子的最大来源是气候变化的科学和预测的不确定性,特别是在区域范围内,”普赖尔说,他是最近一位美国科学促进会。“他们很重要,因为它们既能反射光线,导致云形成,所以他们往往导致表面冷却和抵消一些温室气体造成的全球变暖,”她说。

这些气溶胶的丰度也有一些脚踏实地的对人类健康的影响。数百万人遭受损害健康由于气溶胶暴露的影响。鉴于气溶胶粒子的影响气候和健康深受他们的大小从十倍的宽度小于一个典型的病毒人类hair-Pryor工作跟踪过程发生在从微米尺度公里。

普赖尔的研究旨在量化气溶胶的浓度,在时间和空间的大小和构成,它们对于气候的影响模型,并确定如何以及在哪里从大气中删除。她用地面和卫星辐射计、除了原位仪器测量气溶胶浓度和通量每秒钟几十个大小类。她也使用越来越多的详细和复杂的数值模型进行模拟。

所有这一切导致了巨大的数据量。例如,由美国国家航空航天局地球观测系统生成每天超过4 tb的数据。普赖尔的集团最近完成了模拟12公里网格在整个美国大陆,32层垂直穿过大气层,模拟的浓度超过200 32气体和气溶胶粒子类型和大小。得到的输出也许多移植版。

“这些数据量代表一个无与伦比的机会,产生新的见解的功能与地球表面和大气和互动评价模型用于预测,”普赖尔说。

她的一个项目的重点是研究森林造成的双重角色的形成和去除悬浮微粒,这些角色如何改变不同气候变暖情景下。森林的树冠释放生物挥发性有机化合物(BVOCs)可以形成气溶胶。平均气温升高会导致更高的BVOC排放,可能增加区域气溶胶浓度,进而可以反射更多的阳光,从而抑制本地和地区温室气体变暖。然而,她最近研究显示这种影响是非常依赖于充足的供水:干旱期间“关闭”。这个证据生物圈的复杂性应对气候变暖是一种洞察力通过大数据和技术喂养它,普赖尔说这只是一个开始。

“大数据”的“可用性意味着我们可以问不同的问题,产生新的假设,但它也需要我们开发和应用新的工具来优化复杂的来自不同来源的数据流,使用有不同的特点,不确定性和尺度,”她说。“我觉得一个真正意义上的乐观看来是一个伟大的时间成为科学家!”