字幕组成品列表(Beta)
  • 写在前面
  • Android 平台
    • Game On! 游戏开发系列 - 031
      • Pie Noon - 1503060393
      • The Death of Base Game Activity - 1504030543
      • Surviving OpenGL Context Loss - 1504030546
      • WebP for Game Devs - 1504030547
      • Saved Games In-Depth (Part 1) - 1504070556
      • Saved Games In-Depth (Part 2) - 1504030548
      • Smaller Flipbook Textures with CRABBY - 1504030544
      • Google Tag Manager - 1504030545
      • Flatbuffers - 1505050794
      • Achievement Point Pointers - 1505050796
      • Frequency Scaling - 1505050797
      • Meet the Management APIs - 1501140367
      • Y U Ship Broken Games - 1505050795
    • Android 性能优化 - 088
      • Garbage Collection in Android - 1503170425
      • Performance Cost of Memory Leaks - 1503170424
      • Rendering Performance 101 - 1501130351
      • Understanding Overdraw - 1501130352
      • Understanding VSYNC - 1501130353
      • Tool - Profile GPU Rendering - 1501130354
      • Why 60fps? - 1501130355
      • Android UI and the GPU - 1501130356
      • Invalidations, Layouts, and Performance - 1501130357
      • Overdraw, Cliprect, QuickReject - 1501130358
      • Tool - Memory Monitor - 1501130363
      • Battery Performance 101 - 1501130364
      • Understanding Battery Drain on Android - 1501130365
      • Battery Drain and WakeLocks - 1501130366
      • Memory Performance 101 - 1504170661
    • I/O 2014 Android 开发专题 - 089
      • Activity Transitions - 1504020505
      • Building Apps For Android TV - 1504020520
      • Building great Android media experiences - 1504020510
      • Building a quality app from start to finish - 1504020515
      • App Indexing API - 1504020507
      • What's new in WebView - 1504010484
      • Bluetooth Low Energy - 1504010486
      • Building impressive Android media experiences - 1504010493
      • The next Generation of Authentication - 1504020497
      • Don't Alpha That Pixel! - 1504020523
      • NFC + HCE Your phone in an interactive world - 1504020509
      • Demystifying encodes and decodes of WebM - 1504020521
      • Google Cloud Messaging - 1504020524
      • Getting your Game on the Big Screen - 1504020518
      • I hear you like realtime memes - 1504020511
      • Offerize your App - 1504020506
      • Using the Android Job Scheduler - 1504020504
      • From Holo to Material - 1504020526
      • Under the Hood of Android Auto - 1504020501
      • Isolation for Android App Developers - 1504020498
      • Android Work - 1504010496
      • ExoPlayer: Adaptive video streaming on Android - 1504010489
      • Sample rates and resampling: Why can't we all just agree? - 1504010488
      • Drive Android API - 1504010485
    • Android Studio - 004
      • Layout Editor (Ep 3, Android Studio) - 1503290479
      • Introducing Gradle (Ep 2, Android Studio) - 1503170426
    • I/O 2014 Android 分发主题 - 091
      • Introduction to Google Play - 1504030534
      • Google Play: building your user community - 1504030535
      • Optimizing Apps for Education - 1504030536
      • Succeeding in Education Technology - 1504030530
      • Subscriptions Made Easy with Google Play - 1504030531
      • The world is your playground - go global with Google - 1504030533
      • Maximizing discoverability on Google Play - 1504030538
    • Android Auto - 003
      • Introduction to Android Auto - 1504130615
      • Android Auto Messaging - 1504130617
      • Android Auto Audio - 1504130616
    • Android Wear - 006
      • Designing for Android Wear - 1503210448
      • How We Customized Google Apps for Android Wear - 1503210450
      • Fullscreen apps for Android Wear - 1503210445
      • New Notification Features for Android Wear - 1503210446
      • Building Cloud-powered wearable Apps - 1503210449
      • An Introduction to Android Wear - 1503190435
      • Google I/O 2014 - Android Wear: The developer's perspective - 1503210442
      • Devoxx 2014 Interviews: Android Wear - 1503210440
      • DevBytes: Watch Faces for Android Wear - 1503210439
    • Android TV - 005
      • Using the Leanback library - 1504080588
      • Beach Buggy Racing Multiplayer with Nearby Connections (Play Services) - 1503060387
    • Android for Work - 106
      • Android for Work for Developers - 1503060390
      • App Configurations, Testing and Launchers - 1504110590
    • IO Bytes 2014 - Android - 066
      • Chrome Apps on Android and iOS - 1501080014
      • Perf Primer CPU, GPU and your Android game - 1501080017
  • Chrome 平台
    • IO Bytes 2014 - Chrome and Web - 067
      • Using the PageSpeed API - 1505070815
      • Fabulous Forms for the multi-device web - 1505070816
      • Testing multi-screen web pages - 1505070817
      • Responsive images today - 1505070819
      • Web Performance Testing at YouTube - 1505070828
      • Building sites for the multi-device web - 1505070820
      • Deep dive: Google Cloud Messaging for Chrome - 1505070827
  • Google 创业者资源
    • Coffee with a Googler - 012
      • Chat with Allen Huang of AndroidTV - 1503040384
      • Chat with Fred Chung about developer advocacy - 1503070395
      • Google Fit platform with Michelle Haq - 1503210443
      • Android Auto Product Manager Andrew Brenner - 1501120027
      • Chat with Francis Ma about Google Play services - 1501120028
    • Root Access For Startups - 077
      • What we learned building plug-ins for Android, with startup Magnet - 1503230453
      • How to use crowdfunding to your advantage, with startup Hale Devices - 1503280462
      • How to overcome customer objections when selling tech, with startup Guesswork - 1503280458
    • First Things First - 029
      • Getting started with Android: A crash-course in developing for Android - 1504120601
      • How to ask a question: conducting research for your startup - 1504120603
      • MVP Design Hacks: transform your hot idea into a validated prototype - 1504120602
      • Build something people want: Solving real problems - 1504120605
    • How I - 061
      • Use BigQuery to find my most valuable customers - 1504070573
      • Manage beta testing communities using Google Play - 1504070572
      • Use paper wireframing to build native prototypes - 1504070570
      • Used social media and $0 marketing to get 68 million users - 1504070568
      • Prep to fundraise with four questions - 1504070564
      • Validated my idea in 2 days (with no code) - 1504070562
      • Build open platforms on Android - 1504120596
      • Get cheap, automatic analytics for my business using BigQuery - 1504070571
      • Write press releases to get international media coverage - 1504070569
      • Test beta-product features using Google Apps - 1504070563
      • Use URL builder to measure ROI on social media - 1504070561
      • Use events to build DeadSocial's brand - 1504070557
      • Use BigQuery to visualize streaming data - 1503220452
      • Find, screen, and hire developers - 1503120406
      • Drive engagement with social challenges - 1504070558
  • 设计
    • DesignBytes - 017
      • Paper and Ink: The Materials that Matter - 1505050793
  • 云计算
    • DevBytes: Google Cloud Platform - 021
      • Powering the next killer app with the Google Cloud Platform - 1504210672
      • Introduction to Google Cloud Endpoints - 1504210675
      • The Beauty of Scale with Google Cloud Platform - 1504210678
    • Google Cloud Platform - Big Data - 105
      • GDELT & BigQuery: Understand the world - 1502200379
    • Uncategorized - 999
      • Introducing Google Cloud Platform Resources - 1501190370
  • Google 应用开发
    • Launchpad Online - 072
      • The Setup: Creating new apps using Google APIs - 1503190428
      • Listing your files in Google Drive - 1503190429
      • Customizing Google Analytics for your startup - 1503290473
      • The Launchpad Online series - 1503190427
      • Getting started with Google Analytics - 1503290472
      • Accessing Google Maps from a spreadsheet?!? - 1502220381
      • Change the world in 10 lines of code - 1503080398
    • Google Play Services - 054
      • Google Play services 6.1 - 1503290481
      • Google Play Services 7.0 - 1503200437
      • Google Play Services 6.5 - 1501080015
    • 谷歌地图 iOS SDK - 053
      • Maps Live: New Features in the Google Maps Mobile APIs for Android and iOS - 1504300777
    • Google 移动搜索开发 - 055
      • Is your app in the Google index? - 1504120598
      • Get more engaged users with Google Search for Developers - 1503070397
    • DevBytes: Google Cast - 020
      • Google Cast SDK for Android - 1504180666
      • Media Router Framework - Part 1 - Media Router API - 1504180667
      • Overview for Google Cast Receivers - 1504180664
      • Google Cast SDK for iOS - 1504180663
    • Getting Started with the Google Maps SDK for iOS - 035
      • Getting started with the Google Maps SDK for iOS, Part 1 - 1504270757
    • IO Bytes 2014 - Wearables - 070
      • Voice Driven GDK Glassware - 1505280836
    • Route 85 - 078
      • Introducing Route 85 - 1501120022
      • Quick Tip: Don't Default that Switch! - 1501190371
      • OpenInChrome on iOS, Part 1 - 1501120023
      • OpenInChrome on iOS, Part 2 - 1501120024
      • OpenInChrome on iOS, Part 3 - 1501120025
      • OpenInChrome on iOS, Part 4 - 1501120026
    • DevBytes 2014 - 019
      • Web Components - Template - 1505040789
      • Wearable DataLayer API - 1505050792
      • Using srcset for responsive images - 1505050790
      • The picture element for art direction - 1505050791
    • Uncategorized - 999
      • Sun Surveyor brings augmented reality to photographers using Google Maps APIs - 1504200668
      • Snappy travels with the Roads API - 1503060392
      • Easy Maps Apps in Java and Python - 1501140030
  • Google 广告平台
  • Polymer
    • Polycasts - 076
      • The Awesome Power of Auto-Binding Templates -- Polycasts #08 - 1502220382
      • Content Switcheroo with Core-Pages -- Polycasts #09 - 1502200380
      • Core Iconset -- Polycasts #02 - 1505040788
  • Web 平台
    • HTTP 203 - 062
      • Gotchas - 1501140368
      • Font Rendering - 1501080016
    • Web Components - 081
      • DevBytes: Web Components - Overview - 1504250709
  • 宣传视频
    • Uncategorized - 999
      • Google Developers - 1501150369
      • I/O Extended 2014 - Join me - 1502220383
  • Google 各类开发者会议
    • 2014 Chrome 开发者高峰会议 - 009
      • Keynote - Chrome Dev Summit 2014 (Darin Fisher) - 1503120407
      • TLS All the Things! - Security with Performance(Chris Palmer) - 1503140412
      • Let’s build some apps with Polymer!(Rob Dodson) - 1503150415
      • Day One Closing Remarks(Sundar Pichai) - 1503150417
      • Chrome Leadership panel - 1503160422
      • Fundamentals of Mobile Web Development(Matt Gaunt) - 1503150416
    • 2015 游戏开发者大会中 - 039
      • FlatBuffers - 1504150640
      • Games for Google Cast - 1504150637
      • Top 10 Things Android Game Developers Should Know v 3.0 - 1504150643
      • Automate Publishing for Google Play APIs - 1504150639
      • 3 Game Design Mistakes You're Making - 1504150636
      • Android TV - 1504150638
      • How to Go Viral Without Really Trying - 1504150641
    • Devoxx 2014 Interviews - 024
      • What's new in Android 5.0 Lollipop - 1504260740
      • Android Tools - 1504260743
      • BigQuery and user-defined functions - 1504260744
    • IO Bytes 2014 - 065
      • Dart in Google Cloud - 1505070810
      • Big genomic data on Google Cloud Platform - 1505070811
      • Easy International Checkout with Chrome - 1505070802
      • Google developer tools and APIs for iOS - 1503190436
      • Whet your appetite with IO Bytes - 1501080021
    • PlayTime@Shanghai - 095
      • 主题演讲 Chris Yerga - 1504060549
      • 如何成功地开发你的应用 Ellie Powers - 1504060550
      • 在Google上营利 Brahim Elbouchikhi - 1504060551
      • Playtime Shanghai event sizzle reel - 1504070552
    • Project Google I/O 2015 - 098
      • Project Tango Mobile 3D tracking and perception - 1506120857
      • Democratizing Education - 1506120868
      • Improve your Android app’s accessibility - 1506120864
      • Google Cloud Messaging 3.0 - 1506120844
      • Developers connecting the world through Google Play - 1506120862
  • 开源开放技术
    • Compressor Head - 013
      • The Trailer, Season 2 - 1503060385
      • Behind the Scenes - 1503210441
      • Arithmetic Compression (Ep 5, Compressor Head) Google - 1503070394
      • Introducing Compressor Head - 1502120372
      • Episode 1 (Variable Length Codes) - 1502120373
      • Episode 2 (The LZ77 Compression Family) - 1502120374
      • Episode 3 (Markov Chain Compression) - 1502120375
Powered by GitBook
On this page
  • 译者信息
  • 解说词中文版:

Was this helpful?

  1. Google 各类开发者会议
  2. IO Bytes 2014 - 065

Big genomic data on Google Cloud Platform - 1505070811

PreviousDart in Google Cloud - 1505070810NextEasy International Checkout with Chrome - 1505070802

Last updated 5 years ago

Was this helpful?

视频发布时间

2014年6月25日

视频介绍

As the cost of DNA sequencing has dropped, the volume of data produced has risen into the petabytes. Google is working with the genomics community to define a standard API for working with big genomic data sets in the cloud. Building on Google Cloud Platform, we show how to store, process, explore and share genomic data using technologies like BigQuery, AppEngine MapReduce, R and more.

视频推介语

暂无,待补充。

译者信息

翻译

润稿

终审

原始链接

中文字幕

翻译流水号

加入字幕组

TWL007

葛伟

--

1505070811

解说词中文版:

Google拥有令人叹为观止的云架构

可以让你在其上面运行你的业务程序 移动程序以及进行数据分析

但是你知道Google对科学研究也贡献了很多么

我将要告诉你Google是如何将数据科学以及

生命科学结合在一起的

来服务于健康和基础研究

首先 介绍一些背景知识

人类基因组包含了大约60亿个核苷酸碱基

A C G T (腺嘌呤 胞嘧啶 鸟嘌呤 胸腺嘧啶)

从父母双方各获得30亿个

理论上来讲这不是一个巨大的信息量

尤其是如果你压缩它的话

人类的DNA有99.9%是相同的 但是在实践中

数据文件开始创建的时候远远比理论大得多 因为你需要做很多分析来

确定那些仅占总数0.1%

但却是导致个体不同原因的基因

当科学界对第一个人类基因组测序的时候

其花费了15年的时间 大约30亿美元

值得庆幸的是 自那以后时间以及经济成本大幅度暴跌

如你所知道的 价格如同

测序容量爆炸式增长一样指数级下降

项目已在进行中来测序数以百万计的基因组

有多少数据呢

让我们思考一下

一个基因组100GB

如果你想读取在莫斯科所有人的基因组

那将需要120万TB的硬盘存储空间

所以这真的是一个巨大的挑战

好吧 Google知道关于大数据的一两件事情

Google的搜索索引大概100PB

但仍能在0.25秒内返回搜索结果

这是一个可以将数据科学和生命科学

结合在一起的巨大机遇

想像一下这是多么巨大的冲击

如果全世界的科学家都拥有强力的工具来区分

生病的和健康的人

对疗法产生反应的和状况继续恶化的人

引起疾病爆发和

没有导致爆发无害的病原体

想象一下在没有数据中心的情况下可以

在数秒内得到结果而无需等待几天

这就是我们想要令世界成为的样子

我们的第一份公告就是我们加入了基因组学与健康全球联盟

一个由超过180个顶级大学机构

研究型医院 医疗中心

健康服务提供商

公共健康组织以及公司为了

同一个承诺的目标而组建的国际联盟

我们是一个计算机科学公司

所以我们通过制订了一个标准API

来提升互操作性对团队做出贡献

就像W3C基因组标准那样

我们托管了一个可通过这个API访问的公共数据

并且我们创建了开源软件来展示

如何利用这个API来处理大规模基因组数据

为了给出一个互通性的例子

这是一个可以通过API

来访问数据的基因浏览器

在美国 国家生物技术信息中心已经为他们的

读取序列存档应用了这个API

并且欧洲生物信息研究所也部署了这个API

在Google我们是第三个部署

尽管所有的三个团体用不同的

内部格式存储DNA序列

但是使用同样的软件可以在不修改代码的情况下访问他们

并且这个在几周前就已经实现了

这是个梦幻般的过程

全球联盟有一个Github项目

那里你可以阅读关于数据模型的讨论

以及查看API规范草案

我们有更多的例子在我们的基因组团对的Github代码库中

来展示如何在Python Java R调用API

以及如何利用两种模型来

分析基因信息 这两种模型是

交互查询和大规模并行计算

点击这里来查看Github上的开源代码库

当然 你也可以通过查看我们的在线开发者文档

来详细的了解Goolge基因组学项目

探索基因数据是一个挑战

一方面是因为文件太大

另一方面是因为用来处理他们的计算机技术

已经有几十年的历史了

让我们来看一下那些可以帮助

我们探索DNA序列的21世纪计算机技术

一个Google拥有可以用来对

探索性数据进行分析的工具是BigQuery

底层技术是之前被构建出来

可以以实现互动的速度标准上 用于处理数以万亿行的日志文件

在我们的第一个使用Goolge技术来观察遗传变异的原型中

我们发现BigQuery对于处理那些与群体遗传学

有关的科学问题是一个很好的工具

包括最小的等位基因频率

碱基转换/颠换比率等问题

其工作的方式其实很简单

在你的浏览器中键入SQL查询语句

点击Enter 等几秒 从巨大的数据集中获取结果

当然也有你可以在你的脚本

或者程序中的调用的API

这是一个查询语句的例子

看起来很像SQL吧

我们有多种不同的例子托管在GitHub

你可以复制 粘贴 或者修改他们来查询一些

真正的生物学问题并在数秒内得到答案

现在 让我们看看你可以做什么

我们载入1000条基因组数据

然后对他们进行汇总统计

我们发现了什么

基于这个研究的设计 一半参与者是女性

另一半是男性

呈现了不同的地理组并且一些家庭也被测序了

但是大部分还是独立个体

2000年的时候研究者对255个独立个体

应用了早期基因测试技术

他们发现了关于非洲人种相比世界上其他人种的基因

更具多样性的证据

并且他们或许是现代人类的起源

在2009年大规模的基因测序确认了这项发现

现在 你可以仅仅花费数秒就可以在

超过1000条基因数据上利用BigQuery来测试这些发现

关键的发现 展现在浅红色区域的

非洲人种拥有更多的遗传变异

希望这个可以给你用BigQuery来

查询的问题时添加了一点点趣味

键入一个查询语句

喝一口咖啡 看着结果

然后敲入另外一个稍微不同的查询语句

另一种探索这些基因数据的方式是利用MapReduce

同样是Google用来生成

搜索索引的分布式计算范例

MapReduce是一个通过加入很多服务器到其中

来进行数据并行处理的方法

我们决定运行一个MapReduce来处理这1000条基因数据

每一个圆代表一个个体的变异

使用MapReduce进行主成分分析 简称PCA

把数据映射到解释变异的

二维坐标系上

它大概有整整一页的代码并运行了大约15分钟

在这个图表上我们看见三个清晰的不同集群组织 但是他们代表什么意思

基于人口总数来给他们着色

我们发现三个集群对应了三个世界上人数最多的人种

浅红色是非洲人 蓝色是欧洲人

亚洲人则是绿色

看这个介于欧洲人和非洲人之间的粉色点

这是来自美国西南部的非洲裔美国人

这个真的很酷 但是X轴和Y轴代表什么呢

让我们稍微更深入的了解一下BigQuery

这点SQL语句选择出了有多少变异发生在

一个等位基因与在两个等位基因中

即在一个染色体拷贝中与同时在两个拷贝中

复制 粘贴 点击确定

几秒后你就会得到答案

利用R语言生成图表

我们发现对主成分分析我们生成了一个非常相似的图表

利用MapReduce和BigQuery

我们有两种方法来处理数据

并且我们可以随意的在这两种方法中切换

现在 想象一下我们可以利用1000倍的样品来做什么

利用一个涵盖了显型 疾病 治疗方案 环境的

宽广范围的数以百万计的基因组库

想想你可以利用它学到关于疾病 药物反应以及

更多方面的基因基础的什么样的知识

并且为了实现这个目标 在以后这个世界还将需要更多的计算机加入到这个计划中去

幸运的是 这些例子让你领略了一下

利用Google Cloud Platform将

数据科学和生命科学结合到一起将会发生什么

从今开始这一切都将对你可用

从阅读开发者文档 查看示例代码

尝试基因组浏览器以及

加入我们的论坛里来让你自己上手

我是Jonathan Bingham

谢谢观赏

Youtube
Youtube
加入 GDG 字幕组
video_screenshot