John Allspaw, Đồng sáng lập, Phòng thí nghiệm năng lực thích ứng

Làm thế nào hệ thống của bạn tiếp tục chạy hàng ngày

Đầu tiên, một chút về John Allspaw, Đồng sáng lập Phòng thí nghiệm Năng lực Thích ứng và cựu Giám đốc Công nghệ của Etsy.

Là một nhà lãnh đạo kỹ thuật và nhà nghiên cứu với hơn 20 năm kinh nghiệm trong việc xây dựng và lãnh đạo các nhóm tham gia về kỹ thuật phần mềm và hệ thống, Allspaw đã dành thập kỷ qua để hiểu biết sâu sắc về Nhân tố con người, Kỹ thuật hệ thống nhận thức và Kỹ thuật phục hồi cho lĩnh vực kỹ thuật phần mềm và hoạt động.

Đồng thời là tác giả của hai cuốn sách, Nghệ thuật lập kế hoạch năng lực: Mở rộng quy mô tài nguyên web và các hoạt động web trực tuyến (O KhănReilly Media), Allspaw tiếp tục đóng góp cho cộng đồng CNTT và DevOps thông qua việc nói và hợp tác trong nghiên cứu mới, thú vị.

Chúng tôi đã may mắn được tổ chức John tại Hội nghị thượng đỉnh doanh nghiệp DevOps ở San Francisco, nơi anh ấy đã lên sân khấu để nói về những cách mà hệ thống tiếp tục hoạt động hàng ngày. Dưới đây, chúng tôi đã phiên âm những điểm chính và những điểm nổi bật chính trong bài thuyết trình của anh ấy .

John Allspaw tại DOES17 San Francisco

John Allspaw

Làm thế nào hệ thống của bạn tiếp tục chạy hàng ngày

Những gì tôi muốn nói là mới. Nó là khác nhau, và tôi cảm thấy rất, rất mạnh mẽ về điều này.

Để giúp thiết lập giai đoạn, luận án về bằng cấp của tôi về các yếu tố con người và an toàn hệ thống là sự đánh đổi dưới áp lực: Heuristic và quan sát của các đội giải quyết sự cố ngừng dịch vụ Internet.

Một số bạn có thể đã nghe nói về điều này, điều mà người ta gọi là Báo cáo Stella.

Ở cấp độ cao, báo cáo này là kết quả của một dự án dài một năm của một tập đoàn các đối tác công nghiệp. IBM, Etsy và IEX, công ty thương mại, một sàn giao dịch ở Manhattan. Trong năm nay, những người từ Phòng thí nghiệm Kỹ thuật hệ thống nhận thức của Đại học bang Ohio, David Woods, Richard Cook, và một số người khác đã nhìn sâu vào một sự cố trong mỗi tổ chức đó.

Họ tìm thấy sáu chủ đề này và phổ biến trên tất cả chúng.

Chắc chắn kết quả khá quan trọng. Đó là cách mà nghiên cứu được thực hiện mà tôi muốn tất cả các bạn xem xét.

Đây là những điểm chính của tôi từ báo cáo:

  1. Chúng ta phải bắt đầu thực hiện nghiêm túc hiệu suất của con người trong ngành công nghiệp này. Nếu chúng tôi ủng hộ, chúng tôi sẽ tiếp tục thấy các hệ thống dễ vỡ với những tác động ngày càng tăng đối với các doanh nghiệp và xã hội.
  2. Chúng ta có thể làm điều này bằng cách xem xét các sự cố vượt ra ngoài những gì chúng ta hiện đang làm trong các bài đánh giá sau khi xảy ra hoặc đánh giá sau sự cố hoặc đánh giá sau hành động.
  3. Có tồn tại các phương pháp và phương pháp tiếp cận từ nghiên cứu khả năng phục hồi trong các lĩnh vực khác, nhưng chúng đòi hỏi sự cam kết thực sự để theo đuổi. Làm điều này là cần thiết và khó khăn, nhưng nó sẽ chứng tỏ là một lợi thế cạnh tranh cho các doanh nghiệp làm tốt.

Đầu tiên, tôi muốn bắt đầu với một chút cơ bản, một chút từ vựng mà LỚN sẽ trở nên quan trọng khi tôi sắp xếp bạn thông qua điều này. Tôi sẽ mô tả một loại hình ảnh, một đại diện, giống như một mô hình tinh thần của các tổ chức của bạn, và nó sẽ có một khu vực trên dòng và một khu vực dưới dòng.

Nếu bạn tưởng tượng những gì chúng tôi đã mô tả ở đây, thì đây là sản phẩm của bạn, dịch vụ của bạn, API của bạn hoặc bất cứ điều gì doanh nghiệp của bạn nhận được giá trị từ và cung cấp cho khách hàng. Được chứ? Bên trong đó, những gì bạn thấy là mã của bạn. Bạn thấy ngăn xếp công nghệ của bạn. Bạn thấy dữ liệu và một số cách khác nhau để cung cấp này, phải không? Có lẽ qua internet hoặc một số cách khác. Nhưng nếu chúng ta ở lại đây, sẽ không có ai khác tin tôi rằng đó là những gì chúng ta gọi là hệ thống, bởi vì nó tốt, nhưng nó không thực sự hoàn thiện.

Điều mà thực sự kết nối, và những gì nhiều người đã nói ở đây trong cộng đồng DevOps Enterprise Summit là tất cả những gì chúng ta làm để thao túng những gì diễn ra trong đó, và vì vậy chúng tôi có các công cụ kiểm tra. Chúng tôi đã có các công cụ giám sát. Chúng tôi đã có các công cụ triển khai và tất cả những thứ mà loại sắp xếp có dây. Đây là những thứ mà chúng tôi sử dụng. Bạn có thể nói rằng đây là hệ thống, bởi vì nhiều người trong chúng ta dành thời gian tập trung vào những thứ không có trong bong bóng nhỏ ở đó, nhưng tất cả những thứ xung quanh nó, nhưng nếu chúng ta chỉ ở lại với nó, chúng ta sẽ không thể thấy nơi làm việc thực sự xảy ra.

Những gì chúng tôi sẽ làm ở đây là, chúng tôi sẽ vẽ một đường mà chúng tôi gọi là đường biểu diễn, và sau đó đào sâu hơn một chút. Những gì chúng tôi thấy ở đây là bạn. Tất cả những người đang chuẩn bị sẵn sàng để thêm vào hệ thống, để thay đổi hệ thống. Bạn đang làm khung kiến ​​trúc. Bạn làm giám sát. Bạn có thể theo dõi những gì nó đang làm, cách mà nó làm, và những gì đang diễn ra với họ.

Bây giờ, bạn sẽ nhận thấy rằng mỗi một trong số những người này có một số đại diện tinh thần về hệ thống đó là gì. Nếu bạn nhìn kỹ hơn một chút, bạn sẽ thấy rằng không ai trong số họ giống nhau. Nhân tiện, điều đó rất đặc trưng của các loại vai trò này. Không ai có cùng đại diện cho những gì bên dưới dòng.

Tóm lại, đây là mô hình thế giới của chúng tôi và nó không chỉ bao gồm những thứ đang chạy ở đó, mà tất cả các bạn, các loại hoạt động bạn đang thực hiện, công việc nhận thức mà bạn đang làm để giữ cho thế giới đó hoạt động . Nếu chúng ta chơi với cái này nhiều hơn một chút, chúng ta sẽ có loại mô hình này. Mô hình này có một dòng biểu diễn đi qua giữa và bạn tương tác với thế giới bên dưới dòng thông qua một bộ biểu diễn.

Tương tác của bạn không bao giờ với những thứ chính họ. Bạn don lồng thực sự thay đổi hệ thống.

Những gì bạn làm là bạn tương tác với đại diện và đại diện đó là một cái gì đó về những gì diễn ra bên dưới. Bạn có thể nghĩ về những thứ màu xanh lá cây đó là màn hình mà bạn đang nhìn vào ban ngày, nhưng thông tin duy nhất bạn có về hệ thống đến từ những đại diện này. Họ chỉ là một lỗ khóa nhỏ. Đúng?

Điều quan trọng ở đây là tất cả các hoạt động mà bạn làm, tất cả các hoạt động quan sát, suy luận, dự đoán, lập kế hoạch, sửa chữa, tất cả những thứ đó phải được thực hiện thông qua các đại diện đó, vì vậy có một thế giới bên trên dòng và thế giới bên dưới dòng, và mặc dù bạn và chúng tôi chủ yếu nói về thế giới bên dưới dòng như thể nó rất thật, như thể nó rất cụ thể, như thể đó là một điều gì đó, đây là điều ngạc nhiên.

Đây là vấn đề lớn - bạn không bao giờ có thể nhìn thấy nó.

Nó không tồn tại. Trong một ý nghĩa thực tế, không có dưới dòng mà bạn thực sự có thể chạm vào. Bạn không bao giờ, bao giờ thấy mã chạy. Bạn không bao giờ, bao giờ thấy hệ thống thực sự làm việc. Bạn không bao giờ chạm vào những thứ đó.

Những gì bạn làm là bạn thao túng một thế giới mà bạn không thể nhìn thấy thông qua một tập hợp các đại diện, và đó là lý do tại sao bạn cần xây dựng những mô hình tinh thần đó, những quan niệm đó, những hiểu biết về những gì diễn ra. Đó là những thứ đang thúc đẩy sự thao túng đó. Nó không phải là thế giới bên dưới dòng mà bạn đang làm điều đó. Nó có khả năng khái niệm của bạn để hiểu những điều đã xảy ra trong quá khứ, những việc bạn làm hiện tại và tại sao bạn lại làm những việc đó, những gì quan trọng và tại sao những vấn đề thực sự quan trọng.

Khi bạn chấp nhận viễn cảnh này, một khi bạn bỏ đi rằng ý tưởng bên dưới đường dây là thứ bạn đang xử lý và hiểu rằng bạn thực sự làm việc trên đường dây, mọi thứ sẽ thay đổi.

Những gì bạn thấy trong Báo cáo Stella và dự án đó và các dự án khác mà chúng tôi đã tham gia là theo quan điểm đó và hiểu ý nghĩa thực sự của việc đưa thế giới bên trên thực sự nghiêm túc. Đây là một sự khởi đầu lớn từ rất nhiều những gì bạn đã thấy trong quá khứ, nhưng tôi nghĩ đó là một hướng đi hiệu quả mà chúng ta cần phải thực hiện.

Nói cách khác, các hoạt động nhận thức này (xem bên dưới) ở cả cá nhân và tập thể trong các nhóm lên xuống tổ chức là những gì làm cho doanh nghiệp thực sự hoạt động. Bây giờ, tôi đã nghiên cứu chi tiết này khá lâu ở đây và tôi có thể nói với bạn điều này. Nó không hoạt động theo cách chúng ta nghĩ.

Cuối cùng, để thiết lập khung này, phần quan trọng nhất của ý tưởng này là tất cả những điều này thay đổi theo thời gian. Đó là một quá trình năng động mà liên tục. Đây là đơn vị phân tích. Khi chúng tôi lấy khung đó, chúng tôi có thể hỏi một số câu hỏi. Chúng tôi có thể hỏi một số câu hỏi về phía trên dòng như thế này.

Phần mềm của chúng tôi hoạt động thực sự như thế nào, so với cách mà nó mô tả trong wiki và trong tài liệu và trong các sơ đồ? Chúng tôi biết rằng những người aren toàn diện, họ không chính xác toàn diện.

Phần mềm của chúng tôi thực sự bị hỏng như thế nào, so với cách chúng tôi nghĩ rằng nó sẽ bị hỏng khi chúng tôi thiết kế các biện pháp bảo vệ và bộ ngắt mạch và lan can?

Chúng ta phải làm gì để giữ cho tất cả hoạt động?

Câu hỏi: Hãy tưởng tượng tổ chức của bạn. Điều gì sẽ xảy ra nếu hôm nay lúc sáu giờ, tất cả các công ty của bạn đều rời tay khỏi bàn phím? Họ không trả lời bất kỳ trang nào. Họ không nhìn vào bất kỳ cảnh báo nào. Họ không chạm vào bất kỳ phần nào của nó, mã ứng dụng hoặc mạng hoặc bất kỳ phần nào của nó. Bạn có tự tin rằng dịch vụ của bạn sẽ hoạt động sau một ngày không?

Câu hỏi sau đó là làm thế nào để khám phá những gì xảy ra trên dòng. Chà, có một vài điều. Chúng ta có thể học hỏi từ nghiên cứu về các lĩnh vực có nhịp độ cao, hậu quả cao khác và nếu chúng ta làm như vậy, chúng ta có thể thấy rằng chúng ta có thể nghiên cứu các sự cố. (Lưu ý: khi tôi nói các sự cố của Nhật Bản, tôi có nghĩa là mất điện, xuống cấp, vi phạm, tai nạn, suýt bỏ lỡ và trục trặc - về cơ bản là không lường trước được hoặc các sự kiện bất ngờ).

Điều gì làm cho sự cố thú vị? Vâng, một điều hiển nhiên là mất doanh thu và ảnh hưởng danh tiếng đến một doanh nghiệp cụ thể. Tôi muốn khẳng định một vài lý do khác tại sao sự cố lại thú vị. Một trong những sự cố là định hình thiết kế của các hệ thống con và kiến ​​trúc thành phần mới. Nói cách khác, sự cố của ngày hôm qua thông báo cho các kiến ​​trúc của ngày mai. Đó là, các sự cố giúp thúc đẩy trí tưởng tượng của chúng ta về cách làm cho hệ thống của chúng ta tốt hơn, và do đó, ý tôi là, các sự cố bên dưới ổ đĩa thay đổi trên dòng.

Đó là điều mà. Điều này có thể chi phí tiền thật. Sự cố đôi khi có thể có tác động gần như ngầm hoặc vô hình, đôi khi đáng kể. Ngay bây giờ, rất nhiều người đang chia tách một khối nguyên khối thành các dịch vụ vi mô. Rất nhiều người làm điều đó bởi vì nó cung cấp một số lượng mạnh mẽ mà bạn không có. Bạn lấy cái đó ở đâu?

Bạn đã thông báo bằng các sự cố.

Một lý do khác để xem xét các sự cố là họ có xu hướng sinh ra các hình thức mới của quy định, chính sách, định mức, tuân thủ, kiểm toán, ràng buộc, v.v. Một cách khác để nói rằng đó là sự cố của ngày hôm qua thông báo các quy tắc của ngày mai, ảnh hưởng đến nhân sự , ngân sách, kế hoạch, lộ trình và nhiều hơn nữa. Để tôi cho bạn một ví dụ: Trong giao dịch tài chính, SEC đã đưa ra Quy định SCI. SCI, có lẽ là phần tuân thủ toàn diện và chi tiết nhất trong kỷ nguyên phần mềm hiện đại. SEC đã đi và rất rõ ràng. Chúng tôi có điều này như là một phản ứng đối với sự cố flash năm 2010 đối với Knight Capital, BATS IPO, Facebook IPO. Đó là một phản ứng với sự cố.

Ngay cả khi bạn quay lại xa hơn một chút, người ta vẫn thường trích dẫn rằng PCI DSS xuất hiện khi MasterCard và Visa so sánh các ghi chú, nhận ra rằng họ đã mất khoảng 750 triệu đô la trong 10 năm, vì vậy, tôi có thể, như một sự cố CTO trước đây của một công ty đại chúng, tôi có thể đảm bảo với bạn rằng đây là một thứ rất đắt đỏ, gây mất tập trung và chắc chắn là một gánh nặng cho tất cả các tổ chức của bạn. Sự cố cũng có ý nghĩa theo cách này, nhưng nếu chúng ta nghĩ về sự cố là cơ hội, nếu chúng ta nghĩ về sự cố là tin nhắn, tin nhắn được mã hóa bên dưới dòng đang gửi phía trên dòng và công việc của bạn là giải mã chúng, nếu bạn nghĩ về sự cố như những điều tích cực cố gắng thu hút sự chú ý của bạn vào các phần của hệ thống mà bạn nghĩ rằng bạn đã hiểu biết đầy đủ nhưng bạn đã không làm, đây là những lời nhắc nhở bạn phải liên tục xem xét lại sự tự tin của bạn về cách tất cả hoạt động.

Bây giờ, nếu bạn có quan điểm này, một loạt các điều mở ra. Có một cơ hội để đào tạo mới, công cụ mới, cấu trúc tổ chức mới, động lực tài trợ mới và có thể là những hiểu biết mà đối thủ của bạn không có.

Sự cố giúp chúng tôi đánh giá đồng bằng giữa cách hệ thống của bạn hoạt động và cách chúng tôi nghĩ hệ thống của bạn hoạt động và đồng bằng này hầu như luôn lớn hơn chúng tôi tưởng tượng. Tôi muốn khẳng định có lẽ một cách khác mà bạn có thể đã quen, và nó LỪA ĐẢO điều này. Sự cố là các khoản đầu tư không có kế hoạch vào doanh nghiệp, trong sự tồn tại của công ty bạn. Chúng là những cơ hội vô cùng quý giá để hiểu hệ thống của bạn hoạt động như thế nào, những lỗ hổng nào trong sự chú ý tồn tại và những lợi thế cạnh tranh nào bạn không theo đuổi.

Nếu bạn nghĩ về các sự cố, họ đốt tiền, thời gian, danh tiếng, nhân viên, v.v ... Đây là những chi phí chìm không thể tránh khỏi. Mặc dù vậy, có điều gì đó thú vị về loại hình đầu tư này. Bạn không thể kiểm soát quy mô của khoản đầu tư, vì vậy câu hỏi vẫn còn đó, bạn sẽ tối đa hóa ROI cho khoản đầu tư đó như thế nào?

Khi chúng ta xem xét các sự cố, đây là loại câu hỏi mà chúng ta nghe thấy và nó khá phù hợp với những gì các nhà nghiên cứu tìm thấy trong các hệ thống, lĩnh vực phức tạp khác. Nó đang làm gì? Tại sao nó làm điều đó? Nó sẽ làm gì tiếp theo? Làm thế nào mà nó đi vào trạng thái này? Chuyện gì đang xảy ra vậy? Nếu chúng ta làm Y, nó sẽ giúp chúng ta tìm ra phải làm gì? Có phải nó đang trở nên tồi tệ? Có vẻ như nó đã cố định, nhưng phải không? Nếu chúng ta làm X, nó sẽ ngăn nó trở nên tồi tệ hơn, hay nó sẽ làm cho nó tồi tệ hơn? Ai khác chúng ta nên gọi đó có thể giúp chúng ta? Đây là vấn đề của chúng tôi, hay chúng tôi đang bị tấn công? Điều này phù hợp với nhiều lĩnh vực khác. Hàng không, kiểm soát không lưu, đặc biệt là trong lĩnh vực giàu tự động hóa.

Một điều đáng chú ý khác, đó là sự khởi đầu của bất kỳ sự cố nào, nó thường không chắc chắn hoặc mơ hồ về việc liệu đây có phải là điều khiến chúng ta chìm đắm hay không. Khi bắt đầu một sự cố, chúng tôi chỉ đơn giản là không biết, đặc biệt là nếu nó chứa một lượng lớn sự không chắc chắn và một lượng lớn sự mơ hồ. Nếu nó không chắc chắn và mơ hồ, điều đó có nghĩa là chúng ta đã cạn kiệt các mô hình tinh thần. Họ không phù hợp với những gì chúng ta thấy, và những câu hỏi đó xuất hiện. Chỉ nhận thức muộn màng sẽ cho chúng tôi biết nếu đó là sự kiện khiến công ty sụp đổ hay đó là một buổi chiều thứ ba khó khăn.

Các sự cố cung cấp hiệu chuẩn về cách tập trung vào các quyết định, về cách tập trung chú ý, về cách tập trung phối hợp, về cách tập trung leo thang. Tác động của áp lực thời gian, tác động của sự không chắc chắn, tác động của sự mơ hồ và hậu quả của hậu quả. Nghiên cứu xác nhận những cơ hội này.

Chúng ta nên nhìn sâu vào các sự cố như, các sự kiện thử thách không thường xuyên, bởi vì những trường hợp khó khăn này có tiềm năng lớn nhất để khám phá các yếu tố chuyên môn và các hiện tượng nhận thức liên quan.
- Gary Klein, người khởi xướng nghiên cứu ra quyết định theo chủ nghĩa tự nhiên.

Có một gia đình của các phương pháp, phương pháp và kỹ thuật mòn. Phân tích nhiệm vụ nhận thức. Quá trình truy tìm. Phân tích đàm thoại. Phương pháp quyết định quan trọng. Làm thế nào chúng ta nghĩ rằng postmortem có giá trị trông hơi giống như thế này:

Một sự cố xảy ra. Có lẽ ai đó sẽ đưa ra một dòng thời gian. Chúng tôi có một chút của một cuộc họp. Có thể bạn đã có một mẫu, và bạn điền nó vào, và sau đó ai đó có thể báo cáo hay không, và cuối cùng bạn đã nhận được, vâng, các mục hành động. Chúng tôi nghĩ rằng giá trị lớn nhất, có lẽ là giá trị sớm nhất, là nơi bạn ở trong một cuộc phỏng vấn và mọi người đang đi qua dòng thời gian và bạn có thể như, Oh Oh, Chúa ơi. Chúng tôi biết tất cả điều này.

Đây không phải là những gì các nghiên cứu mang lại. Nghiên cứu cho thấy rằng nếu chúng ta thu thập dữ liệu chủ quan và khách quan từ nhiều nơi, dữ liệu hành vi, mọi người nói gì, mọi người đã làm gì, họ nhìn vào đâu, con đường nào trong chẩn đoán họ đã làm theo và có hiệu quả không? Các mảnh vỡ được tạo điều kiện tốt khiến mọi người đối chiếu và so sánh các mô hình tinh thần của họ nhất thiết là thiếu sót. Bạn có thể tạo ra các kết quả khác nhau, bao gồm những thứ như bootcamp, tài liệu trên tàu, đào tạo thuê mới. Bạn có thể có phản hồi thuận lợi nếu bạn xây dựng một chương trình để đào tạo người hướng dẫn. Bạn có thể thực hiện thay đổi lộ trình, những thay đổi thực sự quan trọng dựa trên những gì bạn học được.

Tôi có thể nói với bạn điều này từ một số kinh nghiệm. Không có gì sâu sắc hơn đối với một kỹ sư mới hoặc một kỹ sư mới bắt đầu sự nghiệp của họ hơn là ở trong một căn phòng với một kỹ sư kỳ cựu, người biết tất cả các ngóc ngách giải thích những điều mà họ có thể chưa từng nói to. Họ có kiến ​​thức. Họ có thể vẽ những bức tranh và sơ đồ mà họ đã từng vẽ trước đây bởi vì họ nghĩ mọi người khác đều biết nó. Đoán xem cái gì? Họ don Góp. Giá trị lớn nhất thực sự ở đây, bởi vì chất lượng của những kết quả này phụ thuộc vào chất lượng của điều đó, sự hiệu chuẩn lại. Đây là một sự mở cửa để hiệu chỉnh lại các mô hình tinh thần.

Từ Báo cáo Stella, nó đã thông báo và hiệu chỉnh lại các mô hình của mọi người về cách thức hoạt động của hệ thống, những hiểu biết của họ về cách thức mà nó dễ bị tổn thương và những cơ hội nào có sẵn để khám phá.

Trong rất nhiều nghiên cứu, trong tất cả các nghiên cứu có trong Báo cáo Stella, và nó cũng phù hợp với kinh nghiệm của tôi tại Etsy, một trong những phản xạ mạnh nhất từ ​​những người thực hiện điều này theo cách thuận tiện để so sánh và tương phản. Tôi đã biết rằng nó hoạt động theo cách đó. Sau đó, luôn luôn có một cách khác, thì Làm thế nào mà nó hoạt động được? Đây là điều buồn cười cho đến khi bạn nhận ra nó nghiêm túc. Điều đó có nghĩa là, cách mà không chỉ tôi nghĩ rằng nó hoạt động theo một cách khác. Bây giờ, tôi thậm chí không thể tưởng tượng được, tôi thậm chí có thể vẽ một bức tranh trong tâm trí của tôi về cách nó có thể có thể hoạt động. Điều đó sẽ đáng lo ngại hơn. Nhân tiện, tôi muốn nói rằng đây không phải là sự liên kết. Như tôi đã nói, thông qua các đại diện, chúng ta nhất thiết phải có những mô hình tinh thần không hoàn chỉnh. Ý tưởng là không có những mô hình tinh thần giống nhau, bởi vì họ luôn luôn không hoàn chỉnh, bởi vì mọi thứ luôn thay đổi, và bởi vì họ sẽ không hoàn hảo. Chúng tôi không muốn mọi người có cùng một mô hình tinh thần vì sau đó tất cả mọi người đều có những điểm mù giống nhau.

Đáng trách - quay trở lại bài viết blog mà tôi đã viết vào năm 2012

Càng vô tội vạ là cọc cổ phần. Nó rất cần thiết, nhưng nó không đủ. Bạn có thể xây dựng một môi trường, một nền văn hóa, một sự ôm ấp, một loại tổ chức chào đón hỗ trợ và cho phép mọi người kể chuyện bằng tất cả các chi tiết lộn xộn, đôi khi là những chi tiết đáng xấu hổ, mà không sợ bị trả thù, để bạn thực sự có thể tiến bộ, và để hiểu những gì đang xảy ra, bạn có thể thiết lập điều kiện đó mà vẫn không học được nhiều. Nó không đủ. Nó cần thiết, nhưng không đủ. Những gì tôi nói về là nỗ lực hơn nhiều so với các đánh giá sau sự cố thông thường. Đúng? Đây là nơi một nhà phân tích, người hỗ trợ có thể chuẩn bị, đối chiếu, tổ chức, phân tích dữ liệu hành vi. Người ta nói gì, người ta làm gì. Có một loạt dữ liệu mà họ có thể sàng lọc để chuẩn bị cho các cuộc phỏng vấn, một cuộc phỏng vấn nhóm, hoặc một cuộc phỏng vấn một chọi một, vượt ra ngoài gợi ý về sự phong phú của các sự cố. Theo dõi điều này mất rất nhiều công việc.

Nhân tiện, mọi người nói chung rất mệt mỏi sau một lần mất điện thực sự, căng thẳng hoặc sự kiện mà đôi khi mọi thứ trở nên rõ ràng. Đó là sức mạnh của nhận thức muộn màng, và bởi vì nó có vẻ rất rõ ràng, nên không có vẻ hữu ích khi có một cuộc phỏng vấn, bởi vì bạn nghĩ rằng bạn đã biết tất cả. Vấn đề khác là các cuộc giao ban sau khi chết cũng bị hạn chế bởi thời gian. Bạn chỉ có phòng hội nghị trong một hoặc hai giờ. Mọi người đều thực sự bận rộn, và đồng hồ đang kêu tích tắc, vì vậy đây là một thách thức để làm điều này thực sự tốt, thậm chí được đưa ra những phương pháp nghiên cứu đó.

Vấn đề khác, đặc biệt là nếu bạn xây dựng một chương trình đào tạo tạo điều kiện thuận lợi như tôi đã làm ở Etsy, thì vẫn còn những thách thức xuất hiện. Điều tôi thích gọi là, mọi người đều có bí ẩn riêng để giải quyết, đó là, hay Don Don lãng phí thời gian của tôi vào những chi tiết mà tôi đã biết.

Bởi vì bạn có thể chỉ có một giờ, bạn cần trích xuất càng nhiều việc học càng tốt. Tất cả các công việc là theo ngữ cảnh. Công việc của bạn để tối đa hóa ROI là khám phá, khám phá và xây dựng lại bối cảnh trong đó công việc được thực hiện trong một sự cố, cách thức làm việc và cách mọi người nghĩ trên đường.

Đánh giá là sự đánh đổi, và đó là bối cảnh.

Kết thúc, tất cả các sự cố có thể tồi tệ hơn. Một quan điểm hời hợt là hỏi, những gì đã sai? Làm thế nào nó phá vỡ? Chúng ta sửa cái gì? Đây là những câu hỏi rất hợp lý. Nếu chúng ta ở một mức độ sâu hơn, và chúng ta có thể hỏi, thì những gì đã xảy ra khiến nó không tệ như nó có thể xảy ra? Một vì chúng ta không chú ý đến những điều đó và không xác định được những thứ đó, chúng tôi có thể ngừng hỗ trợ những thứ đó

Có lẽ lý do tại sao nó đã trở nên tồi tệ hơn là bởi vì ai đó đã gọi Lisa và Lisa biết công cụ của cô ấy. Một cái gì đó từ nghiên cứu là các chuyên gia có thể thấy những gì không có ở đó. Nếu bạn không ủng hộ Lisa, và bạn thậm chí không nhận ra rằng lý do tại sao nó không tệ hơn là vì Lisa ở đó. Hãy quên đi các mục hành động để sửa chữa một cái gì đó trong một thời điểm. Hãy tưởng tượng một thế giới nơi Lisa đi đến một công việc mới.

Hữu ích ở cấp độ chiến lược là một câu hỏi tốt hơn. Làm thế nào chúng ta có thể hỗ trợ, khuyến khích, ủng hộ và tài trợ cho quá trình hiểu biết liên tục trong các hệ thống của chúng tôi? Và có thực sự đưa lên trên các dòng trên một cách bền vững?

Chúng ta sẽ đi đâu từ đây? Tôi đã có một số thách thức cho bạn:

  1. Lưu hành Báo cáo Stella trong công ty của bạn và bắt đầu một cuộc đối thoại. Ngay cả khi bạn quá bận rộn hoặc bạn không có khả năng tự đọc nó, hãy đưa nó cho những người làm. Hỏi họ những gì cộng hưởng. Hỏi họ những gì không có ý nghĩa. Hỏi họ, bắt đầu một cuộc đối thoại.
  2. Nhìn sâu vào cách bạn xử lý các đánh giá sau sự kiện. Quan trọng nhất, hãy đi tìm những người quen thuộc nhất với các chi tiết lộn xộn về cách thức thực hiện công việc và hỏi họ điều này: Giá trị nào bạn nghĩ rằng các đánh giá sau sự cố hiện tại của chúng tôi thực sự có?
  3. Chịu trách nhiệm tìm hiểu nhiều hơn và nhanh hơn từ các sự cố so với đối thủ cạnh tranh của bạn. Bạn có thể xây dựng một tổ chức học tập hoặc bạn đang thua một người.
  4. Chúng ta cần phải thực hiện nghiêm túc hiệu suất của con người. Cuộc thảo luận này đang diễn ra. Nó xảy ra trong điện hạt nhân. Nó xảy ra trong y học. Nó xảy ra trong hàng không, kiểm soát không lưu, trong chữa cháy.

Tầm quan trọng ngày càng tăng của các hệ thống của chúng tôi, tiềm năng gia tăng về thiệt hại kinh tế, chính trị và con người khi chúng không hoạt động tốt, và sự gia tăng của sự phụ thuộc và sự không chắc chắn liên quan đều khiến tôi rất lo lắng. Nếu bạn nhìn vào hệ thống của chính bạn và các vấn đề của nó, tôi nghĩ bạn sẽ đồng ý rằng chúng ta phải làm nhiều hơn là thừa nhận vấn đề này. Chúng ta phải nắm lấy nó. Những gì bạn có thể giúp tôi, xin vui lòng truyền bá thông tin này, những ý tưởng và bài trình bày của tôi từ DevOps Enterprise Summit San Francisco 2017.

Tôi muốn nghe từ bạn. Điều gì cộng hưởng với bạn về điều này? Không có gì? Những thách thức nào bạn phải đối mặt trong org của bạn dọc theo những dòng này? Hãy nói với tôi. Tôi trên Twitter.

Được xuất bản lần đầu tại itrevolution.com vào ngày 30 tháng 4 năm 2018.