[セミナーレポート] データサイエンスセミナー 【found IT project #8】

2017年8月1日

セミナー レビュー

セミナーに登壇してみたいですか?と人に訪ねたら、僕の周辺ではほとんどが、「そんな事はしたくないし、考えられない」という返答でした。 そこには、「人前で話すことが苦手」「人に話せるような内容を持っていない」「考えたこともない」という凡人的な考えが見え隠れするのですが、中には「できれば登壇してみたい」という人も少ないですがいます。 でもそのように答える人でも「そのうちに発表できればやってみたいです」というのは、学生時代の友達同士で休日遊びに行く時に「行けたら行く」と返事をする人を思い出しました。 こう答える人は確実に「行かない」んですけどね。

セミナー参加してきました

久しぶりにお勉強できるセミナーに参加してきました。 メディア工房さんの主催する「データサイエンスセミナー」です。 このセミナーは、メディア工房さんのAI事業部の人たちが、採用を目的と、ビジネスにおいてAIに携わっている人と繋がりたいという事で始めた無料セミナーだったんですが、色んな会社の人に登壇してもらい、内容は無料なのに非常に充実しています。 その上、セミナー後に必ず懇親会を用意してくれていて、ここでの名刺交換が、非常にビジネスや僕個人の人脈形成に役立っています。 ちなみに、セミナーの資料や詳細はConnpassに掲載されていますよ。 データサイエンスセミナー 【found IT project #8】

1. ブロックチェーンの入門解説 (登壇者:あべんべん 氏 Twitter:@abenben)

https://speakerdeck.com/abenben/burotukutienfalseru-men-jie-shuo 登壇者のあべんべんさんは、僕もFacebookでつながっていて、このメディア工房セミナーの当初から他の会社の登壇者を繋いでくれている非常に顔の広い人で、彼のFacebookの書き込みは、世の中で行われているAI系などのセミナーや、文献などが、アウトプットされており、毎日それを追いかけていくだけでも、かなりの情報収集ができて助かっております。 今回は、あべんべんさんの本業である、「ブロックチェーン」について、素人にも分かりやすく、仕組みや技術的な課題、いま現状で抱えている問題点などを教えてくれました。 僕が個人的に理解していたブロックチェーンは、「ビットコイン」の裏の技術」として、P2P方式での分散型データベースシステムという事なんですが、あくまでビットコインと切り離してブロックチェーンという技術についての講義で非常に参考になりました。 そして、資料スライドの最後の方に載っている、他技術との連携で、「AI」「IoT」「AR/VR」などとの組み合わせでブロックチェーンはもっと躍進するかも・・・という所に、個人的なワクワク感を感じて終了になりました。 とりあえず、スライドに掲載されていた書籍を片っ端から読み漁りたくなりますね。

2. AI時代のデータインテグレーションとは(登壇者:吉田哲也 氏)

https://www.appresso.com/ 2つ目のテーマは、「データインテグレーション」ということで、株式会社アプレッソの吉田さんが登壇されていました。 登壇内容は、AIの際のビッグデータがいかに整理されておらず、企業のデータ活用の時に初段階のデータ整理に全体の約80%ほどの労力を費やしているという調査レポートが、僕の中でもあるある感を思い出させてくれました。 そんな時にアプレソ社の製品「DataSpider」という製品は、そうした複数の別のシステムで作られた所謂ビッグデータをきれいに生成してつなぎ合わせることができる「データインテグレーションツール」という事です。 具体的に話を聞いてみると、データの整理は「クレンジング」や「マイグレーション」という作業になるんですが、こうした作業のその前に、データがちゃんとしているかどうかを確認したり、仕様書として書かれていないデータを仕様に落とし込んだりする作業も必要です。 そして、ここには、人の手で泥臭く行う作業もたくさんあり、彼らの会社では、そうした企業の作業を代行する事で、自社の知見を貯めるという目的という点も、他の人が嫌がる作業をビジネスに置き換えられている非常に素晴らしいモデルとモチベーションを感じました。 このDataSpiderは、複数のDataBaseシステム、世の中に点在するAPIシステム、管理部門に点在するエクセルやCSVなどのデータファイル、そして会社ごとに違うERPなどの個別システム情報yたログなどをつなぎ合わせることを目的としていて、すでに、かなりの数のフォーマット対応を実現しています。 そして、何より素晴らしかったのが、彼らの会社はエンジニア部隊が主流で、見えないコンサルティングが強いという事が発表を通して理解できたので、僕の知っている困っている会社に紹介してあげようと思いました。

3. 企業等に蓄積されたデータを分析するための処理機能の提案(下野寿之氏)

https://www.slideshare.net/shimonotoshiyuki/presen-y0727/1 最後の登壇は、デジタルガレージの下野さんというコアなエンジニアの方で、データサイエンティストとして非常に密度の濃い内容でした。 下野さん曰く、「世の中にちゃんと整理されている企業データなど無い」「あれば見せてもらいたいし、是非見たい」というのを冒頭から言われていて、納得感と共に、彼の今までの仕事の中で、そうした設計思想のデータに出会ったことが無いという悲哀を感じさせてくれました。 ただ、残念というわけではなく、それによりどういう思考でそうしたデータと向き合い、彼がツールを作ってきた実績が紹介されていて、エンジニアとして聴き応え十分の内容だったのは間違いありません。 「そもそも、ビッグデータは、データ欠損や、データ構造における不具合が存在していてもおかしくないのに、それを確認できる設計ができていない」という事で、彼の作った、複数軸の串刺しによるデータ確認を行い、不具合のあるレコードを見つけるコマンドラインツールは、僕の今まで行ってきたAWKで作ったシステムと近いものを感じ、非常に親近感が湧いてきました。 下野さんは多くはコマンドラインのパイプ処理とperlを組み合わせて独自のツールを作っているのですが、SQLを使うとデータ処理速度が30倍近く遅くなるので、使わないのだそうだ。 これも、僕の思考とマッチして、ストレージパフォーマンスを最大限に生み出せるUNIXのシステム関数がどれだけ優れているかをソフトウェアエンジニアは知る必要があると思います。 そんな感じで、下野さんのディープでコアな内容は終盤を迎え、書籍の紹介でデータ分析についての内容が多かったのを思うと、少なからずSEと言われるエンジニアは、データについての取扱を行う上で、統計も含めた学問を基礎知識として身につけておかねばならないと強く感じました。

その他

休憩時間中に発表されていた「Smnart Trade」というサービスが少し気になりました。 https://drive.google.com/file/d/0BzHdXIPYlGb1TVJoRWJQNjVNUFU/view エンジニアの人たちが作るアルゴリズムをAI処理をして「最強のアルゴリズムを構築する」という内容で、Githubのスニペット販売ECショップのような印象を受けました。 懇親会でご挨拶できなかったのですが、気になるサービスとしてウォッチしてみたいと思います。 今回のセミナーはヤフーロッジで行われ、おしゃれな空間と、久しぶりの永田町の雰囲気に個人的に少し浸っていたのですが、改めて僕もセミナー登壇したくなりました。 「そのうちね・・・」

このブログを検索

ごあいさつ

このWebサイトは、独自思考で我が道を行くユゲタの少し尖った思考のTechブログです。 毎日興味がどんどん切り替わるので、テーマはマルチになっています。 もしかしたらアイデアに困っている人の助けになるかもしれません。