株式会社ずんだもん技術室AI放送局

著者: 株式会社ずんだもん技術室AI放送局
  • サマリー

  • AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。
    続きを読む 一部表示

あらすじ・解説

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。
エピソード
  • 株式会社ずんだもん技術室AI放送局 podcast 20241129
    2024/11/28
    関連リンク 大人数チームで意思決定のスピードアップのためにやったこと 食べログの予約サービスチームは、利用者増加に伴う組織拡大により、コミュニケーションコスト増大、情報伝達の遅れ、開発スピードの遅延といった課題に直面していました。 これらの課題解決のため、チームは組織編成と情報共有方法に工夫を凝らしました。 まず、2名のエンジニアリングマネージャー(EM)と、複数の小チーム(ユニット)からなるユニット制を採用しました。 EMはそれぞれ異なる領域(運用・改善、プロダクト開発)を担当し、責任範囲を明確化することで、意思決定の迅速化を図りました。 さらに、チームリーダーを配置することで、チーム全体の方針やルールの決定を効率化しました。 ユニットの規模を小さくすることで、リーダーの管理コスト軽減と、リーダーが自ら開発に携われる環境を整備しました。意思決定はボトムアップ型を取り入れ、メンバー、リーダー、マネージャーの各レベルで適切な権限と責任を明確化することで、スピードアップを図りました。 情報共有は、日次と週次の2段階で行われます。 日次では、ボトムアップ型で情報を集約し、重要な課題や意思決定事項を迅速に共有します。 週次では、各ユニットからの情報をEMが集約し、チーム全体に展開することで、チーム全体の状況把握を容易にしました。 他チームとの情報共有は、ユニットリーダーとEMが窓口となり、効率的な情報伝達を実現しています。 今後の展望としては、他チームとのコミュニケーション改善、システムのリモデリングによるドメイン整理、エンジニアリングへの集中を促進するための更なるコミュニケーション改善に取り組むとしています。 これらの取り組みを通じて、開発スピードの向上とエンジニアの生産性向上を目指しています。 本記事は、大規模チームにおける組織設計と情報共有の改善に悩む日本のエンジニアにとって、貴重な参考事例となるでしょう。 引用元: https://tech-blog.tabelog.com/entry/2024/09/tabelog-engineer-information-communication 本番DBのマスターデータを全行ぶっとばすやらかしをしたときのお話、その反省 この記事は、本番DBのマスターデータを誤って全行削除してしまった事例とその反省について記述しています。深夜帯に稼働するSNSサービスにおいて、マスタデータのJSON型カラムを全てブランク値で上書きする作業中に事故が発生しました。原因は、開発環境での動作確認を省略した、UPDATE文によるデータ更新スクリプトの誤作動です。 復旧はRDSのスナップショットからの復元で行われましたが、データ容量が大きかったため1時間程度を要しました。この経験から、以下の反省点が挙げられています。 バックアップの不足: 作業前にSequel ACEによるレコードエクスポートや、CSV形式でのバックアップ(Copy Insert SQL機能活用)を行うべきでした。大量データの場合は、LIMITとOFFSETを使用して分割バックアップが推奨されます。 トランザクションの未活用: START TRANSACTIONとCOMMIT/ROLLBACKによるトランザクション処理を行うべきでした。これにより、更新クエリ実行後のデータ確認を行い、問題なければコミット、問題があればロールバックすることで、データの整合性を確保できます。 スクリプトからの直接クエリ実行: Pythonスクリプトで直接更新SQLを実行する実装は、事故発生時の影響が大きいため避けるべきです。スクリプトはクエリの生成のみとし、実行は手動で行うべきです。 開発環境での動作確認の省略: 過去に同様のスクリプトを使用していたため、開発環境での動作確認を省略しましたが、これは重大なミスでした。時間的制約があっても、開発環境での動作確認は必須です。 この事例は、本番環境での作業におけるリスクと、それを回避するための対策を学ぶ上で非常に貴重な教訓となります。新人エンジニアは、この経験から学び、本番作業前に必ずバックアップを取得し、トランザクション処理を行い、開発環境での動作確認を徹底するよう心がけましょう。 引用元: https://zenn.dev/kazutosakagami/articles/78d1649389c868 Raspberry Pi Compute Module 5 cranks up the power – and the...
    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20241128
    2024/11/27
    関連リンク Former Android leaders are building an ‘operating system for AI agents’ 元Androidのリーダーたちが、AIエージェント向けの「オペレーティングシステム」を開発するスタートアップ企業「/dev/agents」を設立しました。 Googleの元Android製品管理担当副社長であるHugo Barra氏によると、同社はAI業界に「Androidのような革新」をもたらすことを目指しています。 現在、Microsoft、Google、OpenAIなど多くの企業が、自律的にタスクを実行し意思決定を行うAIエージェントの開発に注力しています。しかし、/dev/agentsのCEO兼共同設立者である、Googleの元Androidエンジニアリング担当副社長David Singleton氏は、現状では開発が困難であると指摘しています。 /dev/agentsは、クラウドベースの次世代AIエージェント用OSを開発中で、ユーザーが様々なデバイスで信頼できるエージェントと連携することを目指しています。 Singleton氏によると、AIエージェントには新しいUIパターン、再考されたプライバシーモデル、そして有用なエージェントを簡単に構築できる開発プラットフォームが必要だと述べています。 同社には、Barra氏に加え、MetaでAR/VR担当副社長を務めた元AndroidエンジニアのFicus Kirkpatrick氏(CTO)、ChromeOSのデザインに携わったNicholas Jitkoff氏(最高デザイン責任者)も参加しています。 彼らは、Android開発で培った経験を活かし、AIエージェント開発の課題解決に挑んでいます。 この新しいOSが、AIエージェントの開発と普及に大きな影響を与える可能性があります。 引用元: https://www.theverge.com/2024/11/27/24307525/android-leaders-dev-agents-ai-agent-operating-system-startup Tailor Claudes responses to your personal style Claude.aiは、ユーザーのニーズに合わせてレスポンスのスタイルをカスタマイズできる機能を発表しました。開発者、マーケター、プロダクトチームなど、様々なユーザーが自身のワークフローに最適化されたレスポンスを得られるようになります。 この機能により、Claudeのレスポンスのトーン、構造、形式を調整できます。プリセットとして、「Formal(フォーマル)」「Concise(簡潔)」「Explanatory(説明的)」の3つのスタイルが用意されています。 「Formal」は洗練された明確なレスポンス、「Concise」は短く直接的なレスポンス、「Explanatory」は新しい概念を学ぶための教育的なレスポンスを提供します。 さらに、ユーザー自身でカスタムスタイルを作成することも可能です。自分の好みのコミュニケーションスタイルを反映したサンプルコンテンツをアップロードし、必要な指示を指定することで、Claudeは独自のスタイルを生成します。 GitLab社のように、ビジネスケースの作成、ユーザー文書の更新、マーケティング資料の作成・翻訳など、様々な場面で一貫したコミュニケーションを維持するために活用できます。 使い方は簡単です。Claude.aiのチャットボックスで、プリセットオプションを選択するか、独自のスタイルをカスタマイズするだけです。 自分の自然な作業スタイルに合わせてClaudeを調整し、生産性を向上させることができます。 引用元: https://www.anthropic.com/news/styles OpenAI gets $1.5 billion investment from SoftBank in tender offer CNBCの報道によると、ソフトバンクがOpenAIに15億ドルの投資を行うことが発表されました。これは、公開買い付け(テンダーオファー)という形で実施されたものです。 このニュースは、OpenAIの急速な成長と、その将来性への高い期待を示唆しています。 日本のエンジニアの皆さんにとって、このニュースは、AI分野における技術革新のスピード感、そして巨額の資金がどのように最先端技術開発に投入されているのかを理解する上で重要な示唆となります。 OpenAIの技術は、様々な業界で活用されており、今後も更なる発展が期待されるため、この投資は今後のAI技術開発に大きな影響を与える可能性があります。 特に、日本の企業がAI技術を導入・開発していく上でも、この様な大規模投資による技術開発の動向を注視していくことが重要になります。 引用元: https://www.cnbc.com/video/2024/11/27/openai-gets-1-point-5-billion-investment-from-softbank-in-tender-offern-a-tender-offer.html デマに騙されちゃダメ。Pingで帯域計測は出来...
    続きを読む 一部表示
    1分未満
  • 株式会社ずんだもん技術室AI放送局 podcast 20241127
    2024/11/26
    関連リンク 7 examples of Gemini’s multimodal capabilities in action GoogleのシニアプロダクトマネージャーLogan Kilpatrickによるブログ記事では、Gemini 1.5 Pro(画像・動画理解に最適化されたモデル)を用いたマルチモーダル機能の7つの実例が紹介されています。Geminiは、画像・動画だけでなく、長文PDF(1000ページ以上)も理解し処理できます。 主な機能と例: 詳細な画像説明: 画像の内容を詳細に記述し、質問にも回答できます。プロンプトに応じて説明の長さ、トーン、形式を調整可能です。 長文PDFの理解: 1000ページ以上のPDFを理解し、表の転記、複雑なレイアウトの解釈、図表・スケッチ・手書き文字の認識、構造化された出力やコードの生成が可能です。例として、15四半期のAlphabetの収益報告書(152ページ)からGoogleの収益データを抽出し、表を作成し、matplotlibを用いたグラフを作成する例が示されています。 現実世界の文書の推論: レシート、ラベル、看板、メモ、ホワイトボードのスケッチなど、現実世界の文書から情報を抽出し、JSONオブジェクトとして返すことができます。 ウェブページデータの抽出: ウェブページのスクリーンショットからデータ(画像・動画を含む)を抽出し、JSONなどの構造化された形式で出力できます。ウェブデータAPIやブラウジングエージェントなどのアプリケーションに活用できます。Google Playの書籍ページから書籍名、著者、評価、価格をJSON形式で抽出する例が示されています。 物体検出: 画像内の物体を検出し、バウンディングボックス座標を生成します。ユーザー定義の基準に基づいて物体を検索・推論する機能も備えています。 動画の要約と転写: 最大90分の動画を処理し、要約や転写を作成、日常シーンからの構造化データの抽出、質問への回答、重要な箇所の特定などが可能です。技術講義の動画を高校生向けに要約する例が紹介されています。 動画からの情報抽出: 動画から情報を抽出し、リスト、表、JSONオブジェクトなどの構造化された形式で出力できます。小売、交通、ホームセキュリティなどの分野でのエンティティ検出、スクリーン録画からの非構造化データ抽出などに役立ちます。 制約: 動画処理においては、現状1FPSのサンプリングのため、一部情報が欠落する可能性があります。より高いFPSでのサンプリングは今後の開発予定です。 Gemini APIを活用した開発には、開発者ガイドと開発者フォーラムが役立ちます。 様々なユースケースに対応できる強力なマルチモーダル機能を備えていることがわかります。 引用元: https://developers.googleblog.com/en/7-examples-of-geminis-multimodal-capabilities-in-action/ Now Hear This: World’s Most Flexible Sound Machine Debuts NVIDIAの研究チームが開発した画期的なAIサウンド生成モデル「Fugatto」は、テキストプロンプトだけで音声を生成・変換できる、世界最高レベルの柔軟性を誇るツールです。既存のAIモデルが特定の音声生成や編集に特化しているのに対し、Fugattoは音楽、音声、効果音などを自由に組み合わせ、テキストと音声ファイルの両方から指示を受け付けることができます。 例えば、「悲しい雰囲気のフランス語で話すテキスト」といった複雑な指示にも対応し、アクセントの強さや感情の度合いを細かく調整できます。既存の楽曲に楽器を追加・削除したり、声のアクセントや感情を変えることなども可能です。さらに、既存データにはない全く新しいサウンドも生成できます。例えば、トランペットが吠えたり、サックスが鳴き声をあげたりといった、想像を超える音も作成可能です。 Fugattoは、音楽制作、広告制作、言語学習ツール、ゲーム開発など、幅広い分野で活用できます。音楽プロデューサーは楽曲のプロトタイプ作成や編集に、広告代理店は多言語・多様な感情表現のボイスオーバー作成に活用できます。言語学習ツールでは、好きな声で学習コンテンツをパーソナライズすることも可能です。ゲーム開発者は、ゲーム内の状況に合わせて効果音をリアルタイムで生成・変更できます。 Fugattoは、音声モデリング、音声符号化、音声理解に関するNVIDIAの以前の研究成果を基盤としています。25億個のパラメータを...
    続きを読む 一部表示
    1分未満

株式会社ずんだもん技術室AI放送局に寄せられたリスナーの声

カスタマーレビュー:以下のタブを選択することで、他のサイトのレビューをご覧になれます。