ความสัมพันธ์ระหว่างปัญญากับความกลัวใน production incident

Chokchai Phatharamalai
odds.team
Published in
2 min readMar 27, 2023
Photo by Tim Trad on Unsplash

ผมอ่าน The DevOps Handbook มาถึงบทที่ 19 เค้าพูดถึง Just culture ของ Dr. Sidney Dekker ซึ่งประทับใจผมมาก ผมเลยอยากเอามาแบ่งปันครับ

จากประสบการณ์ที่ผมมีโอกาสได้โค้ชทีมในหลาย ๆ องค์กร สิ่งหนึ่งที่เป็นตัวบอกผมว่างานที่ทำจะมีปัญหาบน production มากน้อยเพียงใด ไม่ใช่ telemetry เทพ ๆ หรือ micro services architecture หรือเทคโนโลยี stack ที่พวกเค้าเลือกใช้ แต่เป็นแนวความคิดของผู้บริหารของทีมพัฒนาเนี่ยแหละที่เป็นตัวบอกใบ้ที่ชัดที่สุด เพราะผมพบว่า ทีม 2 ทีมที่ใช้กันคนละเทคโนโลยี, มี architecture ที่แตกต่างกัน แต่อยู่ภายใต้การดูแลของผู้บริหารคนเดียวกัน ก็จะมีโอกาสเกิดปัญหาบน production พอ ๆ กัน

Bad apple theory

Dr. Dekker แบ่งความเชื่อของผู้บริหารเป็น 2 แบบ แบบแรกเรียกว่า bad apple theory คือผู้บริหารที่เชื่อว่า

ความผิดพลาดของคนทำงานเกิดจากคนแย่ ๆ ที่ทำงานห่วย ๆ

พอเชื่อแบบนี้ เมื่อปัญหาเกิด ก็จะไม่เชื่อใจคนนั้น วิธีแก้คือเพิ่มคนที่จะมาตรวจงานคนนั้นมากขึ้น ๆ บางสถานการณ์ที่ผมเคยเจอหนักขนาดต้องให้ CTO approve change ที่จะขึ้น production ก็มี ปัญหาคือ คนที่มาตรวจแม้จะมีประสบการณ์สูง แต่เค้าอยู่ห่างจากงานมาก เค้าไม่มีข้อมูลจะตัดสินใจได้อย่างดีว่าความเสี่ยงอยู่ตรงไหน ซึ่งบ่อยครั้งผมพบว่าวิธีการนี้แทบจะช่วยลดปัญหาไม่ได้เลย แถมทำให้ทุกอย่างช้าลงมาก ๆ อีก

ลิงตัวที่ห้า

ภายใต้สิ่งแวดล้อมที่เกิดจาก bad apple theory บ่อยครั้งผมจะเห็นคนทำงานตรวจของซ้ำแล้วซ้ำเล่า ทำงานซ้ำซ้อนกัน บ่อยครั้งที่ผมถามว่ากิจกรรมขั้นตอนนี้ทำไปทำไม คำตอบที่ผมมักจะได้กลับมาคือ “อย่าถามผม ผมเป็นลิงตัวที่ห้า”

เรื่องลิง 5 ตัวเป็นการทดลองเพื่อศึกษาเรื่องพฤติกรรมทางสังคม โดยเค้าขังลิงไว้ 5 ตัวและมีกล้วยผูกอยู่บนเพดานกลางห้อง และมีบันไดให้ปีน

เมื่อไหร่ที่มีลิงลองปีนไปดึงกล้วย จะมีน้ำเย็นสาดออกมาจนลิงทุกตัวเปียกปอนและหนาวสั่นกันหมด

พฤติกรรมช่วงแรกของลิงทุกตัวคืออยากกินกล้วย เลยปีนไปดึงกล้วย แล้วน้ำก็สาด ทุกตัวก็ตกใจ หนีไปนั่งสั่นอยู่มุมห้องกันหมด

พอเวลาผ่านไป แค่มีลิงเดินไปจะปีนบันได ก็โดนลิงตัวอื่นรุมกระทืบจนล้มเลิกความตั้งใจจะกินกล้วยไปหมด

สุดท้ายคือไม่มีลิงตัวใดคิดจะปีนบันไดอีก ต่างใช้ชีวิตราวกับไม่เห็นกล้วยนั้น

แล้วเค้าก็เอาลิงตัวเก่าออก 1 ตัวแล้วใส่ลิงตัวใหม่เข้ามาแทน ลิงตัวใหม่เห็นกล้วยก็พยายามปีน ผลคือถูกลิงเก่าอีก 4 ตัวรุมกระทืบจนไม่สนใจกล้วยอีกต่อไป

สัปดาห์ต่อมาเค้าก็เปลี่ยนลิงอีกตัว แล้วลิงตัวใหม่ก็พยายามปีนไปหยิบกล้วย โดนกระทืบจนเมินกล้วยซ้ำไป

แล้วเค้าก็เปลี่ยนลิงทีละตัว ๆ จนถึงลิงตัวที่ 5 ซึ่งเป็นช่วงเวลาที่สำคัญมาก เพราะจังหวะนี้เป็นจังหวะที่ลิงทั้ง 5 ตัวไม่มีตัวไหนมีข้อมูลเลยว่าหยิบกล้วยแล้วจะมีน้ำสาดออกมา สิ่งที่นักวิทยาศาสตร์อยากรู้คือ พอเปลี่ยนลิงตัวที่ห้าเข้ามา ลิงทั้ง 5 ตัวจะช่วยกันปีนไปหยิบกล้วยแล้วโดนน้ำสาดกันหมดไหม

ผลคือลิงตัวที่ 5 ก็โดนกระทืบจนเมินกล้วยเหมือนตัวอื่น ๆ นี่แหละผลของการทำตาม ๆ กันมาโดยไม่ได้เข้าใจเหตุผล ซึ่งบางคนอาจจะมองว่าดี เพราะพิธีกรรมนี้ปกป้องลิงชุดใหม่ไม่ให้โดนน้ำสาดก็ได้ แต่ถ้าสถานการณ์เปลี่ยนไปแล้วไม่มีน้ำสาดอีกต่อไปแล้วหล่ะ? คำถามคือเมื่อไหร่ลิงจะเรียนรู้ว่าหยิบกล้วยได้แล้ว

นี่คือข้อเสียของการบริหารด้วยความกลัว คนทำงานจะอยู่กับการปกปิดความผิด ซึ่งความโปร่งใสที่ลดลงสร้างความเข้าใจผิด ๆ ให้องค์กร และลดโอกาสที่องค์กรจะได้เรียนรู้ร่วมกันเพื่อจะแก้ปัญหาครั้งหน้าได้ดียิ่งขึ้น

Just culture

ความเชื่อแบบที่ 2 คือ just culture แปลตรงตัวคือวัฒนธรรมที่เป็นธรรม ความเชื่อแบบนี้เชื่อว่า

ความผิดพลาดของคนทำงาน เป็นผลลัพธ์ของดีไซน์ของเครื่องมือที่เรามอบให้เค้า

ความเชื่อแบบนี้พลิกเกมตรงที่ เมื่อเกิดปัญหา แทนที่จะตำหนิหรือลงโทษคนที่พลาด จะกลายเป็นการขอข้อมูลจากคนที่พลาดเพื่อเอามาเปลี่ยนเป็นการเรียนรู้ขององค์กรแทน

คนพลาดไม่ได้ถูกมองเป็นคนผิดอีกต่อไป แต่คนพลาดกลายเป็นคนถือข้อมูลที่สำคัญว่าในประสบการณ์ของเค้า เหตุการณ์มันดำเนินไปอย่างไร เพื่อเราจะได้เอาข้อมูลนั้นมาปรับดีไซน์ของเครื่องมือที่เค้าใช้ให้มันไม่เกิดการผิดพลาดซ้ำอีก และแบ่งปันการเรียนรู้นี้ให้กับคนอื่น ๆ ในองค์กรได้ด้วย

โครงสร้างองค์กรเกี่ยวอย่างไร

ความเศร้าคือ ผมมักจะพบสิ่งแวดล้อมแบบแรกมากกว่าแบบที่ 2 แม้ผมจะพบเจอผู้บริหารที่เชื่อในความเชื่อแบบที่ 2 และไม่คิดจะโทษคนทำงานเวลาความผิดพลาดเกิดขึ้น แต่ถ้าผู้บริหารคนอื่นที่ตำแหน่งเท่ากันหรือสูงกว่ามาโทษคนทำงานที่ทำพลาดแทนหล่ะ? ในฐานะที่เป็นผู้นำทีม ผู้บริหารจะปกป้องคนทำงานคนนั้นจากการคุกคามทางจิตใจจากทั่วทั้งองค์กรพร้อมกับรักษาความโปร่งใสของข้อมูลเพื่อการเรียนรู้ไปด้วยกันได้อย่างไร รูปแบบที่ผมเคยเห็นว่าเวิร์คคือการที่ผู้บริหารทุกคนเชื่อในแนวคิดแบบที่ 2 เหมือน ๆ กัน หรือไม่ก็มีความสัมพันธ์ที่ดีกับหัวหน้างานคนนั้นเพียงพอที่จะเก็บความคิดที่อยากตำหนิไว้กับตัวเพราะอยากให้เกียรติหัวหน้างานคนนั้นจัดการทีมตัวเอง ผมเคยเห็นแค่ 2 รูปแบบนี้เท่านั้นที่จะรักษาความปลอดภัยทางสังคมเอาไว้ได้

สำหรับองค์กรที่ยังมีการแบ่งระหว่างฝ่ายไอทีกับฝ่ายธุรกิจอยู่ในยุคปัจจุบันที่ซอฟต์แวร์กลายเป็นของจำเป็นในการขับเคลื่อนธุรกิจนั้น แทบจะมีปัญหาเหมือน ๆ กันคือทุกฝ่ายธุรกิจต้องการให้ไอทีช่วยงาน แล้วงานก็ไปกองอยู่ที่ฝ่ายไอทีที่มีทั้งข้อมูลและความชำนาญไม่พอที่จะจะเรียงลำดับความสำคัญของงาน ผลคือทุกฝ่ายธุรกิจบ่นว่าไอทีช้า ทั้ง ๆ ที่ใช้งบประมาณเยอะสุด พอเหตุการณ์นี้ดำเนินไปนาน ๆ ความไม่พอใจของฝ่ายธุรกิจต่าง ๆ ก็จะมากขึ้นเรื่อย ๆ จนเราสามารถได้ยินความเป็นปฏิปักษ์อยู่ในภาษาที่ใช้ได้เลย เช่น “ผมไม่สนใจว่าไอทีจะไปทำมายังไง แต่ต้องทำให้เสร็จให้ทันให้ได้แม้ว่าจะต้องทำงานหนักเพียงใดก็ตาม”

ในสถานการณ์ลักษณะนี้ แทบจะเป็นไปไม่ได้เลยที่หัวหน้างานในฝ่ายไอทีจะปกป้องคนทำงานจากการคุกคามทางจิตใจจากหัวหน้างานคนอื่นที่ไม่ได้สนใจว่าคนทำงานในฝ่ายไอทีจะรู้สึกอย่างไรได้ เป็นผลให้บรรยากาศกลายเป็นแบบ bad apple theory อยู่ดีแม้ว่าหัวหน้างานจะเชื่อเรื่อง just culture ก็ตาม

นี่คือเหตุผลที่ผมใช้อธิบายตัวเองว่าทำไมผมถึงเห็นบรรยากาศแบบ bad apple theory บ่อยกว่า just culture

สรุป

บ่อยครั้งที่ผมเห็นผู้คนแชร์เทคนิคดี ๆ เพื่อเพิ่มการเรียนรู้ขององค์กร เช่น blameless retrospective หรือ fail party ที่ทุกคนมาแบ่งปันว่าพลาดอะไรและได้เรียนรู้อะไรในช่วงที่ผ่านมา แต่ผมเพิ่งจะตระหนักว่าผมเห็นเทคนิคเหล่านี้ เบ่งบานในบรรยากาศของ just culture เท่านั้น

ผมเคยพยายามปรับใช้เทคนิคเหล่านี้ในองค์กรที่อยู่ในบรรยากาศแบบ bad apple theory ซึ่งความรู้สึกเหมือนตำน้ำพริกละลายแม่น้ำเลย แต่ผมไม่เคยเข้าใจว่าทำไมมันยากแบบนี้ที่นี่นะ

คำว่า just culture ของ Dr. Dekker ทำให้ผมตระหนักถึงความสำคัญของบรรยากาศที่สนับสนุนให้เทคนิคเพื่อการเรียนรู้เหล่านี้เบ่งบาน การแก้ปัญหาที่ปลายเหตุบางครั้งก็ทำให้อะไร ๆ ดีขึ้นได้หน่อยนึง ซึ่งบางครั้งหน่อยนึงที่ดีขึ้นนั้นก็เพียงพอให้องค์กรเดินต่อไปข้างหน้าแล้ว แต่ถ้าเมื่อไหร่ที่เราพบว่าปัญหาเดิม ๆ มันวนกลับมาอีก อาจจะเป็นเวลาดีที่จะเริ่มแก้ปัญหาที่ต้นเหตุเพื่อพัฒนาการที่ยั่งยืน

--

--