ON DEMAND SESSIONS

運用苦労話(しくじり、トラシュー)

DMMプラットフォーム ゼロから始めるKubernetes運用 課題と改善
効果的なアラートを再考する [メモリ使用率が80%になりました。] んで、どうすればいいん?
AWSを触ったことの無い運用者が、AWS環境のインフラ運用巻取りを通じて、運用改善を出来る様になるまでのお話
国内最大級のコンテナ型データセンタをイチから作ってみた~クラウドの先にあるモノ~
信頼性を落とさず効果的にオンコールを減らす取り組みを目指して エンジニアの睡眠時間を守ろう
神エクセルもない状態からの脱却、読める書けるぞTerraform
OpenStack NFV基盤のバージョンアップと運用改善を内製対応した話(KDDI編)
楽天モバイルの仮想化基盤開発に”本格”Agileを取り入れた話
顧客影響に気づけるアラート設計と原因特定が素早くできるSREへ ヤプリが乗り越えてきた監視運用の失敗と改善
転生したら大規模サービス運用担当者になっていた件~AzureでSaaS提供に奮闘する男の物語~
失敗あるある on Azure
Yahoo! JAPAN プライベートクラウドにおける事故防止の取り組みの変遷

運用自動化(Dev/Ops, CI/CD)

インフラのCI/CDはGitHub Actionsに任せた。
KubernetesでCIをやりたい?それならTektonでしょ!
IaC や CI に理解のある上司になる(なってもらう)には
高速データ配送基盤の実現に向けた先進的ハードウェアの活用と性能評価作業の自動化に関する取組み
Ansibleを活用したzabbixの構築・運用の自動化
監視オペレータはもういらない?ーAmazon Connectを用いた、スペシャリスト自動手配システムの内製開発ー
面倒なことはK8sにさせよう kapp controllerによる宣言的なデプロイとパッケージ管理
目指せ!安心・安定のサービスリリース ~CI/CD で立ち向かうタケシくんの奮闘記~
Salt/SaltStack Configではじめるソフトウェア構成管理とインフラ自動化
PagerDutyでシステムノイズを削減し、インシデントの解決を自動化する方法
Hinemosはクラウド徹底対応!Hinemosによるクラウド活用の最新事例
オンプレ・仮想化・クラウドどこでも使えるHinemos ミッションクリティカル機能
ChatOpsで「Kubernetes Operator」にオペレータさせてみた
インフラ部門に配属された新卒社員がAWS,SSMとか色々使ってテスト環境の構築時間を爆速にした件
文書作成ソフトからの脱却 ~Markdownによるアラート対応手順書CI/CD~
コンテナから非仮想化環境までネットワーク運用が変わる。ついにあのCNIが復活。
SlackBotであらゆる業務を自動化。問い合わせ〜DevOpsまで

大規模システム運用

Multi Cluster monitoring & How to save ourselves during major outages
 エンタープライズ向けクラウドサービス 仮想サーバ基盤開発のリリースサイクル改善
運用自動化ツールStackStormによる大規模OpenStackのセルフヒーリング
Kubernetesを活用したエッジコンピューティング時代の運用
Kubernetesが必要するデータセンターとサーバー
2万台規模のIaaSを監視するPrometheusが安定稼働するまでの道のり
楽天市場を支える大規模なシステムのリアルタイム監視 ~ ゼロからデファクトスタンダードまで ~
NGINXとNGINX Service Mesh で実現するトラフィック運用のいろは
巨大マイクロサービスの歩き方 ~ F5 Distributed Cloud Serviceの裏側
The Future of Open Edge Infrastructures
ユーザシステムのクラウド運用からトータルオペレーションへの拡大

サービス・アプリケーション運用

Cloud Run から GKE Autopilot へ、FAANS における Kubernetes 移行の背景とは
開発者と運用者の壁をぶち壊せ!InnerLoopとOuterLoopとは?
いま注目されているセキュリティ要件「SBOM」とは?DevSecOpsに重要な品質保証の仕組みを解説
そのシステム、ちゃんと理解できてます? – Jupyter Notebookを用いた運用のススメ
大規模IoT x マイクロサービス開発を加速に向けたSRE組織立ち上げの取り組み
クレジットカード会社のGameday、あるいはKubernetesに”Gremlin”を解き放った話
NGINX Kubernetes Gatewayについて知っておくべきこと
F5 Distributed Cloud Service のローンチに関連するインフラ上の変更点
Kubernetes 環境の本番運用で頭を悩ます非機能要件への対応
あーー、やっちまったを防ごう!本番環境のセキュリティ対策で痛い目を見ないようにするための開発手法をご紹介!
VMware に入社してみたら SDGs がすごかった!
OpsRampが変革する、MSP(マネージドサービスプロバイダー)ビジネスとは!?

社内基盤(情シス、開発環境)

OpenFlowでベアメタルクラウドネットワークを制御してみた
CloudNative DaysのObservabilityの裏側
おしゃれは足元の開発基盤から – 小さく始めるゼロトラスト101
Kubernetesを使ったエンタープライズ企業におけるSREの導入ステップ
元 System Center 屋、現製品マーケが察するクラウド時代の運用のカオス
OpsRampでこう変わった!情シス運用の現在と未来
高性能VM提供によるインフラコスト削減
今日からはじめる機械学習/MLOps
Datadogで実現するオブザーバビリティ
不審な振る舞いを監視して証拠を残す、デジタル世界のセキュリティカメラSysdig Secure入門

製品・技術トレンド

Zabbix と New Relic の利点を活かすクラウド運用
「XPU + 光I/O」融合に向けた開発と、ネットワークプログラマビリティの発展
大規模クラウドを支える最新の分散ソフトウェア・デファインド・ストレージアーキテクチャとそれを支えるインテルの技術
クラウド・ワークロードのパフォーマンス、コスト、電力を最適化するためのインテルのツール
ITインフラのサステナビリティーを実現するIntel(r) Data Center ManagerとメモリーRAS テクノロジーIntel(r) Memory Resilience Technologyのご紹介
オンプレで利用可能なクラウドサービスHPE GreenLakeを活用した運用業務の省力化

Cloud CoE

CCoE特別講座 ~エンジニアに贈るクラウド推進組織活用法~
通信だけの会社じゃない!NTT東日本が取り組むCCoE活動
たった3名でCloud CoEを立ち上げてみた