Website : https://pagerduty.digitalstacks.net/
Categories : DevOps & IT管理
PagerDutyは、オンプレミスやクラウドで稼働しているシステムに不具合が生じたとき、あらゆる監視ツールからのアラート情報を受け取り対応する、システム全体のアラートビッグデータシステムを月額数万円で簡単に構築できるサービスです。
一度PagerDutyを設定することで、オンプレミス、クラウド、ハイブリッドを問わず他部門や他システムで導入している異なる監視ツールを含めた全システムのアラート情報が自動的に一元管理され、全障害情報の管理・蓄積が開始されます。全てのアラート情報がビッグデータとして収集され始めると、次の障害が発生する前に担当エンジニアは過去の類似パターンから予兆管理や障害分析・予兆分析も可能となり、自社が開発・運用するシステムの障害発生やエンジニアの深夜の障害対応時間などを大きく抑制することが可能になります。
■ アラートの集約と分類
・イベントを集約し、分類し、相関させ、重要なものを管理できます
■ 多様なアラート機能
・適切な情報を適切な人に適切な手段で提供します
■ スケジューリングと自動エスカレーション
・オンコールスケジュール、ローテーション、エスカレーションを設定できます
■ モバイルでのインシデント管理
・優れたユーザーインターフェイスで、外出先からインシデントを管理できます
■ リアルタイムコラボレーション
・ChatOpsツール、ヘルプデスクサービスとの連携により、適切なチームに連絡できます
■ システム&ユーザーレポート
・システムの効率化、従業員の生産性を把握できます
■ 信頼性の高い環境
・高品質なサービスを提供するためのインフラを整備しています
■ エンタープライズレベルのセキュリティー
・ロールベースのアクセス許可を管理するための管理コントロールを備えています
■ 監視サービスのグループ化
・複数の監視サービスを簡単にグループ化できます
■ プラットフォームの拡張性
・あらゆるツールと連携できる信頼できるプラットフォーム
■ ライブコールルーティング
・オンコールスケジュールとエスカレーションポリシーを使って、オンコールのレスポンダーにすぐに連絡することができます
■ 事後検証
・事後検証プロセスを合理化することで、インシデントを解決し予防する力を高められます
日産自動車、スマートニュース
CHEF Code Can, backcountry, codeship, GoodData, Weebly, Nextdoor, Hubspot, SafeinHome, eHarmony, C2FO, Lonely Planet, The Trainline.com, Groupon, BulletProof, MLS, Chartbeat, SIMPLE, Ping Identity, Concur, BrightCove, Sumologic, Wooga, Beamly Panasonic, eNett, GREE, POLITICO, Pressable, WPEngine, Conspire, inkling, here, Mozilla Firefox, realnetworks, slack, Spark Networks, eMoxie, Optaros, Oregon State University, Polydice, Path, tunein, netskope, DataDog, Conde Nast, intuit, Wikimedia Foundation, indeed, dns europe, Cascadeo, Blue Communications Inc, awe.sm, DramaFever, University of California Riverside, Python, Pinterest, Rubicon Project, Salesforce Desk, dotCloud, Airbnb, BONOBOS, Rail Machine, Heroku, invite media, Stumble Upon, Evernote, 2012 Barachobama.com, Fog Creek Software
AWS, Amazon CloudWatch, Amazon GuardDuty, AWS CloudTrail, AWS Personal Health Dashboard, Atlassian Jira (Cloud), Atlassian Jira (Server), Atlassian Jira Ops, Datadog, Dynatrace, New Relic, SignalFx, Sumo Logic, Threat Stack, Anodot, Ansible, Apica, AppDynamics, Atlassian, BMC Remedy, Bitbucket, Blue Matador, CA UIM (Nimsoft), Catchpoint, Checkly, Cisco Webex Teams, Demisto, Dynatrace AppMon, Expel, Firebase, Google Stackdriver, HipChat Extension, HipChat Server, HipChat Slash Command, Honeybadger, Humio, IBM Bluemix, IOpipe, ITRS Geneos, ITmanager.net, Icinga, InfluxData, Instana, LightStep, LogDNA, LogicMonitor, Microsoft Azure Alerts, Moesif, NodePing, Opsview, Oracle Cloud Infrastructure Monitoring, Oracle Developer Cloud Service, OverOps | Takipi, Pivotal Cloud Foundry, RigD Slack App, Rollbar, Scalyr, Sentry, ServiceNow Enterprise, ServiceNow Express, Signal Sciences, Slack Extension, Slack Slash Command, Splunk, Splunk Security, StatusCake, StatusHub, Stride, Twistlock, Uptime, Wavefront by VMware, Zapier, Zenoss, AlienVault, AppBeat, AppFirst, AppFormix, AppOptics, Apteligent, Aruba, Atatus, Auth0, BMC TrueSight Pulse, BigPanda, Bitbar, Bitium, CA Single Sign-On (SiteMinder), CFEngine, Centrify, Check_MK, Circonus, Cloud Insights, CloudMonix, Cloudsploit, Consul, Conviva Video AI Alerts, CopperEgg, DNS Check, DNSmonitor, Datadog Add-on, Dead Man's Snitch, DeferPanic, Dell Foglight, Desk.com, Detectify, Errorception, Evident.io, Fabric, Flowdock, Freshservice, Front App, FusionReactor Cloud, G Suite, Ghost Inspector, Gitter, Glip, Graylog, HP SiteScope, Healthchecks.io, HetrixTools, Hubot, IPSentry, Incapsula, InsightFinder, Intellinote, Ixia Hawkeye, Kayako, Keynote, Know Normal, Kore, Librato, LibreNMS, Lilac Reloaded, Logentries, Loggly, Logsene, Logstash, Logtrust, Logz-io, Loom Systems, Lyatiss Cloudweaver, Mackerel.io, Mailhop, Marketo Integration Guide, Mattermost, Microsoft Active Directory, Microsoft Azure SSO, Microsoft Cloud App Security, Microsoft Flow, Microsoft OMS, Microsoft SCOM, Microsoft Teams, MongoDB Cloud Manager, Monit, Monitis, Moxtra, Munin, MxToolbox, NS1, Nagios, Nagios XI, Neptune.io, NetBeez, NetHelpDesk, Netuitive, Neustar, Observium, Okta, OneLogin, OpsDash, Opsee, Opsmatic, PRTG Network Monitor, Pandora FMS, Panopta, Papertrail, Pepperdata, PingFederate, PingOne, Pingdom, Pingometer, Postman, Poweradmin, Powercode, Prometheus, Pulseway, Puppet, Quest Spotlight Enterprise, RBLTracker, RSA Security, Rackspace Cloud Monitoring, RapidSpike, Raygun, Red Canary, Red Gate SQL Monitor, Riemann, Rigor, Runscope, SaltStack, ScienceLogic, Scout, SearchStax, SecureAuth, Sematext SPM, Sensu, Server Density, Seyren, Site24x7, SiteUptime, SmartBear's AlertSite UXM, Snitch, Soasta, Socialcast, SolarWinds Orion, StackStorm, Stathat, Status.io, StatusCast, StatusPage.io, Steward, Sysdig Cloud, Temboo, Testomato, ThousandEyes, Uptrends, V6Sonar, VMware vCenter, Watcher, Webmon, WhatsUp Gold, Wormly Webhooks, Xplenty, Zabbix, Zendesk, ipPatrol
https://dxable.com/blogs/case-study/pagerduty-case01
日米2500 万ダウンロードを超えるニュースアプリ「SmartNews(スマートニュース)」は、広範な提携メディアのコンテンツから注目のコンテンツを独自のアルゴリズムで選び出し、スマートフォンの画面に凝縮する。パーソナライズ路線を突き進まず、多様性のあるコンテンツに出会えるようにしているのが特徴だ。その背後で24時間365日働き続けているシステムの構築・運用をしているエンジニアに、緊急事態を知らせるインシデント管理システム、PagerDutyの使い心地を尋ねた。
Read more ➝
https://dxable.com/blogs/case-study/pagerduty-interview02
世界累計利用者数4900 万人を突破(2019 年1月現在)した株式会社ミクシィのXFLAG が提供するスマホアプリ「モンスターストライク」(以下、モンスト)。その巨大インフラ、システムの運用にPagerDuty を活用しているSRE チームのエンジニアに使用感を尋ねた。
Read more ➝
Q. オンコールエンジニアがアラートに応答しない場合はどうなりますか?
A. PagerDutyでは包括的なエスカレーションルールを指定できます。インシデントがトリガされると、PagerDutyは最初にレベル1のオンコールエンジニアにそのインシデントの連絡を試みます。その人がユーザー指定のエスカレーションタイムアウト内に応答しない場合、PagerDutyは自動的にレベル2のエンジニアに警告をエスカレートします。