ข้อมูล

ความแตกต่างทางพันธุกรรมที่เป็นกลางคืออะไร?

ความแตกต่างทางพันธุกรรมที่เป็นกลางคืออะไร?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

ความแตกต่างทางพันธุกรรมที่เป็นกลางคืออะไร? น่าจะเป็นการวัดระยะห่างระหว่างสิ่งมีชีวิตในแง่ของพันธุกรรม แต่ 'เป็นกลาง' หมายถึงอะไร?


ความแปรปรวนทางพันธุกรรมที่เป็นกลางคือการเปลี่ยนแปลงที่ไม่มีผลต่อสมรรถภาพทางกาย ฉันแนะนำให้อ่านเพิ่มเติมเกี่ยวกับทฤษฎีที่เป็นกลางในวิกิพีเดีย

ความแตกต่างทางพันธุกรรมที่เป็นกลางเป็นวิธีพูดถึงความผันแปรทางพันธุกรรมที่เป็นกลางซึ่งเป็นไปตามรูปแบบทางประวัติศาสตร์บางอย่าง ตัวอย่างเช่น ประชากรสองกลุ่มที่แยกจากกันเป็นเวลานานจะแสดงความแตกต่างทางพันธุกรรมที่เป็นกลาง แม้ว่าจะอยู่ในสมดุลของ Hardy-Weinberg กล่าวอีกนัยหนึ่ง ประชากรทั้งสองจะมีความถี่อัลลีลที่แตกต่างกันบ้างจากกันและกัน โดยไม่มีเหตุผลที่เกี่ยวข้องกับการคัดเลือกโดยธรรมชาติ แต่เนื่องมาจากการสุ่มตัวอย่างแบบสุ่มและการเปลี่ยนแปลงทางพันธุกรรมเมื่อเวลาผ่านไป

โดยทั่วไปคิดว่าการเปลี่ยนแปลงทางพันธุกรรมส่วนใหญ่เป็นกลางหรือเกือบเป็นกลาง ตัวอย่างเช่น จีโนมมนุษย์ส่วนใหญ่เป็น DNA ที่ไร้ประโยชน์หรือจีโนมปรสิต เช่น ทรานสโปซอน ความผันแปรทางพันธุกรรมเกือบทั้งหมดที่เกิดขึ้นในภูมิภาคเหล่านั้นไม่สำคัญต่อสมรรถภาพของมนุษย์ กล่าวคือ "เป็นกลาง"


สารพันอ้างอิง

สิ่งมีชีวิตที่โตเต็มวัยประกอบด้วยเซลล์หลายประเภทที่แตกต่างกัน เซลล์ถูกจัดระเบียบเป็นเนื้อเยื่อ ซึ่งโดยทั่วไปแล้วแต่ละเซลล์จะมีประเภทเซลล์จำนวนน้อยและมีหน้าที่เฉพาะทางสรีรวิทยา เช่น เนื้อเยื่อบุผิวที่เยื่อบุลำไส้เล็ก...

…ความผิดปกติของการพัฒนาหรือความแตกต่างของเนื้อเยื่อ ซึ่งรวมถึงเนื้องอกประเภทเนื้อเยื่อเดี่ยวหรือเนื้อเยื่อผสม ซึ่งอาจส่งผลกระทบต่อส่วนใดส่วนหนึ่งของร่างกาย โดยมีความเสี่ยงที่จะเกิดการเปลี่ยนแปลงที่ร้ายแรง ส่วนใหญ่เป็นระยะ ๆ แต่บางส่วนได้รับการสืบทอดอย่างเด่นชัด ใน dysplasias จำนวนมากการกลายพันธุ์ของยีนเป็นหย่อมและต้องการการสูญเสียปกติ ...

…สัตว์แต่ยังทำให้เกิดความแตกต่างของเซลล์ต้นกำเนิด pluripotent (เซลล์ที่มีศักยภาพที่จะกลายเป็นเซลล์ชนิดต่างๆ มากมาย) กล่าวอีกนัยหนึ่ง การเปลี่ยนแปลงของอีพีเจเนติกส์ทำให้เซลล์ทั้งหมดมี DNA เดียวกันและในที่สุดก็ได้มาจากไข่ที่ปฏิสนธิแล้วจะกลายเป็นเฉพาะทาง ตัวอย่างเช่น ตับ...

เกิดขึ้นใน

ความแตกต่างเป็นเพียงกระบวนการของการแตกต่าง ในการเชื่อมต่อกับการพัฒนาทางชีววิทยา morphogenesis ถูกกำหนดไว้เป็นส่วนประกอบสำหรับการพิจารณาแยกจากกัน จะมีความแตกต่างที่แตกต่างกันสองประเภท ในประเภทแรก ส่วนหนึ่งของระบบที่กำลังพัฒนาจะเปลี่ยนไปใน...

ความแตกต่างของเนื้อเยื่อของตัวอ่อนจะดำเนินไปอย่างรวดเร็วในช่วงแรกของการพัฒนา และสิ่งที่จะกลายเป็นโครงสร้างผิวหนังของผู้ใหญ่ รวมทั้งต่อมและอวัยวะต่างๆ จะถูกวางลงก่อนที่สัตว์จะเกิด ซึ่งมักจะอยู่ในระยะแฝง เพื่อกลับมาพัฒนาต่อในภายหลัง

…รูปร่างเป็นรูปแบบหนึ่งของการสร้างความแตกต่างของเซลล์ คำในความหมายทั่วไปหมายถึงการเปลี่ยนแปลงในการทำงาน มักจะมาพร้อมกับความเชี่ยวชาญพิเศษและการสูญเสียความสามารถในการแบ่งต่อไป ความแตกต่างทางชีวเคมีมักเกี่ยวข้องกับการเปลี่ยนแปลงลักษณะของออร์แกเนลล์ของเซลล์—เมื่อศักยภาพทั่วไป...

ในสิ่งมีชีวิตที่กำลังพัฒนา ความแตกต่างหมายถึงการเพิ่มความซับซ้อนของโครงสร้างและการทำงาน ความแตกต่างประเภทหนึ่งเกี่ยวข้องกับการเปลี่ยนแปลงรูปร่างโดยรวมและการจัดระเบียบ กิจกรรมดังกล่าว ซึ่งเกี่ยวข้องกับการหล่อหลอมร่างกายและส่วนประกอบที่สำคัญของมันให้อยู่ในรูปแบบและรูปแบบ ประกอบรวมด้วยกระบวนการที่เรียกว่า morphogenesis กระบวนการของ morphogenesis ค่อนข้างง่าย...

ทฤษฎีของ

…ความเข้าใจอย่างลึกซึ้งเกี่ยวกับความแตกต่างทางชีวภาพ โดยเฉพาะอย่างยิ่งปัจจัยที่ควบคุมความแตกต่าง สิ่งสำคัญสำหรับการศึกษาเหล่านี้คือการพัฒนาวิธีการเพาะเลี้ยงเนื้อเยื่อในช่วงปลายศตวรรษที่ 20 ซึ่งช่วยให้มีการเจริญเติบโตของเซลล์ต้นกำเนิดจากตัวอ่อนของสัตว์เลี้ยงลูกด้วยนม—และท้ายที่สุดแล้วเซลล์ต้นกำเนิดจากตัวอ่อนของมนุษย์—บนแผ่นเพาะเลี้ยง

...ในทางชีววิทยา การตีความว่าวัสดุที่ไม่แตกต่างกันค่อยๆ กลายเป็นเฉพาะทาง อย่างเป็นระเบียบ เข้าไปในโครงสร้างสำหรับผู้ใหญ่ แม้ว่ากระบวนการอีพีเจเนติกส์นี้จะได้รับการยอมรับว่าเป็นลักษณะทั่วไปของการพัฒนาทั้งในพืชและสัตว์ แต่คำถามมากมายยังคงต้องแก้ไข มารี ฟรองซัวส์ ซาเวียร์ บิชาต แพทย์ชาวฝรั่งเศส ประกาศว่า…


สารบัญ

Charles Darwin ให้ความเห็นเกี่ยวกับแนวคิดเรื่องการกลายพันธุ์ที่เป็นกลางในงานของเขา โดยตั้งสมมติฐานว่าการกลายพันธุ์ที่ไม่ได้ให้ข้อดีหรือข้อเสียอาจผันผวนหรือกลายเป็นคงที่นอกเหนือจากการคัดเลือกโดยธรรมชาติ "การแปรผันที่ไม่มีประโยชน์และไม่เป็นอันตรายจะไม่ได้รับผลกระทบจากการคัดเลือกโดยธรรมชาติ และจะถูกปล่อยให้เป็นองค์ประกอบที่ผันผวน ดังที่เราเห็นในสายพันธุ์พหุสัณฐานบางสายพันธุ์ หรือในที่สุดจะได้รับการแก้ไข เนื่องจากธรรมชาติของสิ่งมีชีวิตและธรรมชาติของ เงื่อนไข." ในขณะที่ดาร์วินได้รับการยกย่องอย่างกว้างขวางในการแนะนำแนวคิดการคัดเลือกโดยธรรมชาติซึ่งเป็นจุดสนใจของการศึกษาของเขา เขายังเห็นความเป็นไปได้สำหรับการเปลี่ยนแปลงที่ไม่เป็นประโยชน์หรือทำร้ายร่างกาย [1]

ทัศนะของดาร์วินเกี่ยวกับการเปลี่ยนแปลงส่วนใหญ่ขับเคลื่อนโดยคุณลักษณะที่เอื้อประโยชน์เป็นที่ยอมรับกันอย่างกว้างขวางจนถึงทศวรรษ 1960 [2] ขณะทำการวิจัยการกลายพันธุ์ที่สร้างการแทนที่นิวคลีโอไทด์ในปี 1968 โมโตโอะ คิมูระพบว่าอัตราการทดแทนนั้นสูงมากจนหากการกลายพันธุ์แต่ละครั้งดีขึ้น ช่องว่างระหว่างจีโนไทป์ที่พอดีที่สุดกับจีโนไทป์ทั่วไปจะมีขนาดใหญ่อย่างไม่น่าเชื่อ อย่างไรก็ตาม Kimura อธิบายอัตราการกลายพันธุ์ที่รวดเร็วนี้โดยแนะนำว่าการกลายพันธุ์ส่วนใหญ่เป็นกลาง กล่าวคือ มีผลเพียงเล็กน้อยหรือไม่มีเลยต่อความสมบูรณ์ของร่างกาย Kimura ได้พัฒนาแบบจำลองทางคณิตศาสตร์ของพฤติกรรมของการกลายพันธุ์ที่เป็นกลางภายใต้การเบี่ยงเบนทางพันธุกรรมแบบสุ่มในประชากรทางชีววิทยา ทฤษฎีนี้กลายเป็นที่รู้จักในฐานะทฤษฎีที่เป็นกลางของวิวัฒนาการระดับโมเลกุล [3]

เนื่องจากเทคโนโลยีช่วยให้วิเคราะห์ข้อมูลจีโนมได้ดีขึ้น การวิจัยจึงดำเนินต่อไปในพื้นที่นี้ แม้ว่าการคัดเลือกโดยธรรมชาติอาจส่งเสริมการปรับตัวให้เข้ากับสภาพแวดล้อมที่เปลี่ยนแปลงไป การกลายพันธุ์ที่เป็นกลางอาจผลักดันให้เกิดความแตกต่างของสปีชีส์อันเนื่องมาจากการเบี่ยงเบนทางพันธุกรรมแบบสุ่ม [2]

การกลายพันธุ์ที่เป็นกลางได้กลายเป็นส่วนหนึ่งของทฤษฎีที่เป็นกลางของวิวัฒนาการระดับโมเลกุลซึ่งเสนอในทศวรรษที่ 1960 ทฤษฎีนี้ชี้ให้เห็นว่าการกลายพันธุ์ที่เป็นกลางมีส่วนรับผิดชอบต่อการเปลี่ยนแปลงลำดับดีเอ็นเอในสปีชีส์ส่วนใหญ่ ตัวอย่างเช่น อินซูลินจากวัวและของมนุษย์ ในขณะที่ลำดับกรดอะมิโนต่างกันยังคงสามารถทำหน้าที่เดียวกันได้ ดังนั้นการแทนที่กรดอะมิโนระหว่างสปีชีส์จึงเห็นว่าเป็นกลางหรือไม่ส่งผลต่อการทำงานของโปรตีน การกลายพันธุ์ที่เป็นกลางและทฤษฎีที่เป็นกลางของวิวัฒนาการระดับโมเลกุลไม่ได้แยกออกจากการคัดเลือกโดยธรรมชาติ แต่เพิ่มเข้าไปในความคิดดั้งเดิมของดาร์วิน การกลายพันธุ์สามารถให้ประโยชน์ สร้างความเสียเปรียบ หรือไม่สร้างความแตกต่างที่วัดได้ต่อการอยู่รอดของสิ่งมีชีวิต [4]

การสังเกตจำนวนหนึ่งที่เกี่ยวข้องกับการกลายพันธุ์ที่เป็นกลางได้รับการทำนายในทฤษฎีที่เป็นกลาง ได้แก่ กรดอะมิโนที่มีคุณสมบัติทางชีวเคมีที่คล้ายคลึงกันควรถูกแทนที่บ่อยกว่าการแทนที่กรดอะมิโนที่มีความหมายเหมือนกันทางชีวเคมีควรสังเกตบ่อยกว่าการแทนที่ที่ไม่มีความหมายเหมือนกันที่อินตรอนควรมีวิวัฒนาการในอัตราเดียวกับ การกลายพันธุ์ที่มีความหมายเหมือนกันในการเข้ารหัส exons และ pseudogenes ควรมีวิวัฒนาการในอัตราที่ใกล้เคียงกัน การคาดการณ์เหล่านี้ได้รับการยืนยันด้วยการแนะนำข้อมูลทางพันธุกรรมเพิ่มเติมตั้งแต่การแนะนำทฤษฎี [2]

การกลายพันธุ์แบบพ้องเสียงของเบส Edit

เมื่อนิวคลีโอไทด์ที่ไม่ถูกต้องถูกแทรกระหว่างการจำลองแบบหรือการถอดรหัสของบริเวณที่กำหนดรหัส มันสามารถส่งผลต่อการแปลลำดับในท้ายที่สุดของลำดับไปเป็นกรดอะมิโน เนื่องจากมีการใช้โคดอนหลายตัวสำหรับกรดอะมิโนตัวเดียวกัน การเปลี่ยนแปลงในเบสเดียวอาจยังนำไปสู่การแปลของกรดอะมิโนตัวเดียวกัน ปรากฏการณ์นี้เรียกว่าความเสื่อมและทำให้เกิดการผสมผสาน codon ที่หลากหลายซึ่งนำไปสู่การผลิตกรดอะมิโนชนิดเดียวกัน ตัวอย่างเช่น รหัส TCT, TCC, TCA, TCG, AGT และ AGC รหัสทั้งหมดสำหรับซีรีนของกรดอะมิโน สิ่งนี้สามารถอธิบายได้ด้วยแนวคิดวอกแวก ฟรานซิส คริก เสนอทฤษฎีนี้เพื่ออธิบายว่าทำไมโมเลกุล tRNA จำเพาะจึงสามารถจำแนกโคดอนได้หลายตัว พื้นที่ของ tRNA ที่รับรู้ codon ที่เรียกว่า anticodon สามารถผูกฐานที่เปลี่ยนได้หลายตัวที่ปลาย 5' เนื่องจากมีความอิสระเชิงพื้นที่ เบสที่ห้าที่เรียกว่าไอโนซีนยังสามารถแทนที่บน tRNA และสามารถจับกับ A, U หรือ C ได้ ความยืดหยุ่นนี้ช่วยให้เปลี่ยนแปลงเบสในโคดอนที่นำไปสู่การแปลกรดอะมิโนชนิดเดียวกันได้ [5] การเปลี่ยนแปลงของเบสในโคดอนโดยไม่มีการเปลี่ยนแปลงของกรดอะมิโนที่แปลแล้วเรียกว่าการกลายพันธุ์ที่มีความหมายเหมือนกัน เนื่องจากกรดอะมิโนที่แปลแล้วยังคงเหมือนเดิม การกลายพันธุ์ที่มีความหมายเหมือนกันจึงถูกมองว่าเป็นการกลายพันธุ์ที่เป็นกลาง [6] งานวิจัยบางชิ้นแนะนำว่ามีอคติในการเลือกการแทนที่เบสในการกลายพันธุ์ที่มีความหมายเหมือนกัน นี่อาจเป็นเพราะแรงกดดันในการเลือกเพื่อปรับปรุงประสิทธิภาพการแปลที่เกี่ยวข้องกับ tRNA ที่มีอยู่มากที่สุดหรือเพียงแค่อคติของการกลายพันธุ์ [7] หากการกลายพันธุ์เหล่านี้มีอิทธิพลต่ออัตราการแปลหรือความสามารถของสิ่งมีชีวิตในการผลิตโปรตีน พวกมันอาจส่งผลต่อความเหมาะสมของสิ่งมีชีวิตที่ได้รับผลกระทบ [6]

คุณสมบัติทางชีวเคมีของกรดอะมิโน ไม่มีขั้ว โพลาร์ ขั้นพื้นฐาน กรด การสิ้นสุด: หยุด codon
รหัสพันธุกรรมมาตรฐาน
ที่ 1
ฐาน
ฐานที่ 2 ครั้งที่ 3
ฐาน
NS NS NS
NS TTT (P/F) ฟีนิลอะลานีน TCT (Ser/S) ซีรีน ททท (Tyr/Y) ไทโรซีน TGT (Cys/C) ซีสเตอีน NS
TTC TCC TAC TGC
TTA (Leu/L) ลิวซีน TCA TA หยุด (Ocher) [NS] TGA หยุด (โอปอล์) [NS] NS
ทีทีจี [เอ] TCG แท็ก หยุด (อำพัน) [NS] TGG (Trp/W) ทริปโตเฟน NS
CTT CCT (โปร/พี) โพรลีน แมว (เขา/ส) ฮิสติดีน CGT (Arg/R) อาร์จินีน NS
CTC CCC CAC CGC
CTA CCA CAA (Gln/Q) กลูตามีน CGA NS
ซีทีจี [เอ] CCG CAG CGG NS
NS ATT (Ile/I) ไอโซลิวซีน กระทำ (Thr/T) ธรีโอนีน AAT (Asn/N) แอสพาราจีน AGT (Ser/S) ซีรีน NS
ATC ACC AAC AGC
ATA ACA AAA (Lys/K) ไลซีน AGA (Arg/R) อาร์จินีน NS
เอทีจี [เอ] (พบ/M) เมไทโอนีน ACG AAG AGG NS
NS GTT (Val/V) วาลีน GCT (อลา/อ) อะลานีน GAT (Asp/D) กรดแอสปาร์ติก GGT (Gly/G) ไกลซีน NS
GTC GCC GAC GGC
GTA GCA GAA (Glu/E) กรดกลูตามิก GGA NS
GTG GCG ปิดปาก GGG NS
NS โคดอน ATG ทั้งสองรหัสสำหรับเมไทโอนีนและทำหน้าที่เป็นไซต์เริ่มต้น: ATG ตัวแรกในภูมิภาคการเข้ารหัสของ mRNA คือจุดเริ่มต้นของการแปลเป็นโปรตีน [8] codon เริ่มต้นอื่น ๆ ที่ระบุโดย GenBank นั้นหายากในยูคาริโอตและโดยทั่วไปแล้วจะเป็นรหัสสำหรับ Met/fMet [9] NS ^ ^ ^ พื้นฐานทางประวัติศาสตร์สำหรับการกำหนดโคดอนหยุดเป็นอำพัน สีเหลือง และโอปอล อธิบายไว้ในอัตชีวประวัติของซิดนีย์ เบรนเนอร์ [10] และในบทความประวัติศาสตร์โดยบ็อบ เอ็ดการ์ (11)

การแทนที่กรดอะมิโนเป็นกลาง แก้ไข

ในขณะที่การแทนที่ของเบสในพื้นที่ที่ไม่มีรหัสของจีโนมอาจสร้างความแตกต่างเพียงเล็กน้อยและถือว่าเป็นกลาง การแทนที่เบสในหรือรอบ ๆ ยีนอาจส่งผลกระทบต่อสิ่งมีชีวิต การแทนที่เบสบางตัวนำไปสู่การกลายพันธุ์ที่มีความหมายเหมือนกันและไม่มีความแตกต่างในกรดอะมิโนที่แปลตามที่ระบุไว้ข้างต้น อย่างไรก็ตาม การแทนที่เบสยังสามารถเปลี่ยนรหัสพันธุกรรมเพื่อแปลกรดอะมิโนที่ต่างกันออกไป การแทนที่ประเภทนี้มักจะมีผลเสียต่อโปรตีนที่กำลังก่อตัวและจะถูกกำจัดออกจากประชากรผ่านการคัดเลือกที่บริสุทธิ์ อย่างไรก็ตาม หากการเปลี่ยนแปลงมีผลในเชิงบวก การกลายพันธุ์อาจกลายเป็นเรื่องธรรมดามากขึ้นในประชากรจนกว่าจะกลายเป็นชิ้นส่วนทางพันธุกรรมที่ตายตัวของประชากรนั้น สิ่งมีชีวิตที่เปลี่ยนแปลงผ่านสองตัวเลือกนี้ประกอบด้วยมุมมองคลาสสิกของการคัดเลือกโดยธรรมชาติ ความเป็นไปได้ประการที่สามคือการแทนที่กรดอะมิโนทำให้เกิดความแตกต่างทางบวกหรือทางลบเพียงเล็กน้อยหรือไม่มีเลยกับโปรตีนที่ได้รับผลกระทบ [12] โปรตีนแสดงให้เห็นถึงความทนทานต่อการเปลี่ยนแปลงโครงสร้างกรดอะมิโน สิ่งนี้ค่อนข้างขึ้นอยู่กับตำแหน่งในการทดแทนโปรตีน ถ้ามันเกิดขึ้นในพื้นที่โครงสร้างที่สำคัญหรือในบริเวณที่ทำงาน การแทนที่กรดอะมิโนหนึ่งตัวอาจหยุดทำงานหรือเปลี่ยนการทำหน้าที่ของโปรตีนอย่างเป็นสำคัญ การเปลี่ยนตัวในพื้นที่อื่นอาจเกือบเป็นกลางและเลื่อนแบบสุ่มเมื่อเวลาผ่านไป [13]

การกลายพันธุ์ที่เป็นกลางจะวัดในประชากรและพันธุศาสตร์วิวัฒนาการโดยพิจารณาจากความแปรผันของประชากร สิ่งเหล่านี้ได้รับการวัดในอดีตโดยเจลอิเล็กโตรโฟรีซิสเพื่อกำหนดความถี่อัลโลไซม์ [14] การวิเคราะห์ทางสถิติของข้อมูลนี้ใช้เพื่อเปรียบเทียบความผันแปรกับค่าที่คาดการณ์โดยพิจารณาจากขนาดประชากร อัตราการกลายพันธุ์ และขนาดประชากรที่มีประสิทธิผล การสังเกตในระยะแรกซึ่งบ่งชี้ว่ามีความแตกต่างกันมากกว่าที่คาดไว้และความผันแปรโดยรวมภายในไอโซฟอร์มของโปรตีนที่ศึกษา ทำให้เกิดข้อโต้แย้งเกี่ยวกับบทบาทของการคัดเลือกในการรักษาความผันแปรนี้กับการมีอยู่ของความแปรผันผ่านผลของการกลายพันธุ์ที่เป็นกลางที่เกิดขึ้นและการกระจายแบบสุ่มของพวกมันเนื่องจากการเบี่ยงเบนทางพันธุกรรม [15] [16] [17] การสะสมของข้อมูลโดยอาศัยพหุสัณฐานที่สังเกตได้นำไปสู่การก่อตัวของทฤษฎีวิวัฒนาการที่เป็นกลาง [15] ตามทฤษฎีวิวัฒนาการที่เป็นกลาง อัตราการตรึงในประชากรของการกลายพันธุ์ที่เป็นกลางจะเกี่ยวข้องโดยตรงกับอัตราการก่อตัวของอัลลีลที่เป็นกลาง [18]

ในการคำนวณดั้งเดิมของ Kimura การกลายพันธุ์ด้วย |2 NNS|<1 หรือ |NS|≤1/(2N) ถูกกำหนดให้เป็นกลาง [15] [17] ในสมการนี้ N คือขนาดประชากรที่มีประสิทธิผลและเป็นการวัดเชิงปริมาณของขนาดประชากรในอุดมคติที่ถือว่าค่าคงที่ดังกล่าวเป็นอัตราส่วนทางเพศที่เท่ากันและไม่มีการอพยพ การอพยพ การกลายพันธุ์หรือการเลือก [19] อนุรักษ์นิยม มักสันนิษฐานว่าขนาดประชากรที่มีประสิทธิภาพอยู่ที่ประมาณหนึ่งในห้าของขนาดประชากรทั้งหมด (20) NS คือสัมประสิทธิ์การเลือกและเป็นค่าระหว่าง 0 ถึง 1 เป็นการวัดการมีส่วนร่วมของจีโนไทป์กับคนรุ่นต่อไปโดยที่ค่า 1 จะถูกเลือกโดยสมบูรณ์และไม่มีส่วนร่วมและ 0 ไม่ถูกเลือกเลย [21] คำจำกัดความของการกลายพันธุ์ที่เป็นกลางนี้ได้รับการวิพากษ์วิจารณ์เนื่องจากความจริงที่ว่าขนาดประชากรที่มีประสิทธิภาพมากสามารถทำให้การกลายพันธุ์ด้วยค่าสัมประสิทธิ์การคัดเลือกขนาดเล็กปรากฏว่าไม่เป็นกลาง นอกจากนี้ การกลายพันธุ์ที่มีค่าสัมประสิทธิ์การคัดเลือกสูงอาจปรากฏเป็นกลางในประชากรที่มีขนาดเล็กมาก [17] สมมติฐานที่ทดสอบได้ของคิมูระและอื่น ๆ แสดงให้เห็นว่าพหุสัณฐานภายในสปีชีส์นั้นใกล้เคียงกับที่คาดไว้ในแบบจำลองวิวัฒนาการที่เป็นกลาง [17] [22] [23]

สำหรับวิธีการทางอณูชีววิทยาหลายๆ วิธี เมื่อเทียบกับพันธุศาสตร์ทางคณิตศาสตร์ โดยทั่วไปแล้วการกลายพันธุ์ที่เป็นกลางจะถือว่าเป็นการกลายพันธุ์ที่ไม่ก่อให้เกิดผลกระทบที่ประเมินค่าได้ต่อการทำงานของยีน การทำให้เข้าใจง่ายนี้ขจัดผลกระทบของความแตกต่างเล็กน้อยในความฟิต และหลีกเลี่ยงปัญหาเมื่อการเลือกมีผลเพียงเล็กน้อย [17]

หลักฐานที่น่าเชื่อถือในช่วงต้นของคำจำกัดความของการกลายพันธุ์ที่เป็นกลางนี้แสดงให้เห็นผ่านอัตราการกลายพันธุ์ที่ต่ำกว่าในส่วนที่มีความสำคัญทางหน้าที่ของยีน เช่น ไซโตโครมคเทียบกับส่วนที่มีความสำคัญน้อยกว่า [24] และลักษณะที่สับเปลี่ยนได้ตามหน้าที่ของไซโตโครมซีของสัตว์เลี้ยงลูกด้วยนมในการศึกษาในหลอดทดลอง [25] nonfunctional pseudogenes ให้หลักฐานเพิ่มเติมเกี่ยวกับบทบาทของการกลายพันธุ์ที่เป็นกลางในวิวัฒนาการ อัตราการกลายพันธุ์ในสัตว์เลี้ยงลูกด้วยนมเทียมปลอมนั้นแสดงให้เห็นว่าสูงกว่าอัตราในยีนที่ทำหน้าที่ได้มาก [26] [27] ตามวิวัฒนาการของ neo-Darwinian การกลายพันธุ์ดังกล่าวไม่น่าจะเกิดขึ้นได้เนื่องจากลำดับเหล่านี้ไม่มีหน้าที่และการคัดเลือกในเชิงบวกจะไม่สามารถทำงานได้ [17]

การทดสอบ McDonald-Kreitman [28] ถูกใช้เพื่อศึกษาการคัดเลือกในช่วงเวลาวิวัฒนาการที่ยาวนาน นี่คือการทดสอบทางสถิติที่เปรียบเทียบพหุสัณฐานในตำแหน่งที่เป็นกลางและเชิงฟังก์ชัน และประมาณการว่าส่วนใดของการแทนที่ได้กระทำโดยการเลือกในเชิงบวก การทดสอบมักใช้การแทนที่แบบพ้องความหมายในยีนที่เข้ารหัสโปรตีนเป็นองค์ประกอบที่เป็นกลาง อย่างไรก็ตาม การกลายพันธุ์ที่มีความหมายเหมือนกันได้แสดงให้เห็นว่าอยู่ภายใต้การคัดเลือกเพื่อทำให้บริสุทธิ์ในหลาย ๆ กรณี [30] [31]

นาฬิกาโมเลกุลสามารถใช้ในการประมาณระยะเวลาตั้งแต่ความแตกต่างของสองสปีชีส์และสำหรับการวางเหตุการณ์วิวัฒนาการในเวลา [32] Pauling และ Zuckerkandl เสนอแนวคิดของนาฬิกาโมเลกุลในปี 1962 โดยอิงจากการสังเกตว่ากระบวนการกลายพันธุ์แบบสุ่มเกิดขึ้นในอัตราคงที่โดยประมาณ โปรตีนแต่ละชนิดแสดงให้เห็นว่ามีอัตราเชิงเส้นของการเปลี่ยนแปลงของกรดอะมิโนในช่วงเวลาวิวัฒนาการ [33] แม้จะมีการโต้เถียงจากนักชีววิทยาบางคนที่โต้เถียงว่าวิวัฒนาการทางสัณฐานวิทยาจะไม่ดำเนินไปในอัตราคงที่ การเปลี่ยนแปลงของกรดอะมิโนจำนวนมากแสดงให้เห็นว่าสะสมในลักษณะคงที่ Kimura และ Ohta อธิบายอัตราเหล่านี้เป็นส่วนหนึ่งของกรอบทฤษฎีที่เป็นกลาง การกลายพันธุ์เหล่านี้มีเหตุผลให้เป็นกลาง เนื่องจากการคัดเลือกในเชิงบวกควรเกิดขึ้นได้ยาก และการกลายพันธุ์ที่เป็นอันตรายควรถูกกำจัดออกจากประชากรอย่างรวดเร็ว [34] ด้วยเหตุผลนี้ การสะสมของการกลายพันธุ์ที่เป็นกลางเหล่านี้ควรได้รับอิทธิพลจากอัตราการกลายพันธุ์เท่านั้น ดังนั้นอัตราการกลายพันธุ์ที่เป็นกลางในสิ่งมีชีวิตแต่ละชนิดควรตรงกับอัตราการวิวัฒนาการของโมเลกุลในสปีชีส์ในช่วงเวลาวิวัฒนาการ อัตราการกลายพันธุ์ที่เป็นกลางได้รับผลกระทบจากปริมาณของตำแหน่งที่เป็นกลางในลำดับโปรตีนหรือดีเอ็นเอ เทียบกับปริมาณของการกลายพันธุ์ในไซต์ที่ถูกจำกัดการทำงาน โดยการหาปริมาณการกลายพันธุ์ที่เป็นกลางเหล่านี้ในโปรตีนและ/หรือ DNA และเปรียบเทียบพวกมันระหว่างสปีชีส์หรือกลุ่มที่น่าสนใจอื่นๆ อัตราของไดเวอร์เจนซ์สามารถกำหนดได้ [32] [35]

นาฬิกาโมเลกุลทำให้เกิดความขัดแย้งเนื่องจากวันที่เกิดขึ้นจากเหตุการณ์ต่างๆ เช่น การแผ่รังสีที่ระเบิดหลังจากเหตุการณ์การสูญพันธุ์ เช่น การระเบิด Cambrian และการแผ่รังสีของสัตว์เลี้ยงลูกด้วยนมและนก มีความแตกต่างสองเท่าในวันที่ที่ได้จากนาฬิกาโมเลกุลและบันทึกฟอสซิล ในขณะที่นักบรรพชีวินวิทยาบางคนโต้แย้งว่านาฬิกาโมเลกุลมีความไม่แม่นยำอย่างเป็นระบบ แต่คนอื่นๆ กลับมองว่าความคลาดเคลื่อนนั้นเกิดจากการไม่มีข้อมูลฟอสซิลที่แข็งแกร่งและความเอนเอียงในการสุ่มตัวอย่าง [36] แม้ว่าจะไม่มีความมั่นคงและความคลาดเคลื่อนกับบันทึกฟอสซิล ข้อมูลจากนาฬิกาโมเลกุลได้แสดงให้เห็นว่าวิวัฒนาการถูกครอบงำโดยกลไกของแบบจำลองที่เป็นกลางอย่างไรและได้รับอิทธิพลน้อยกว่าจากการกระทำของการคัดเลือกโดยธรรมชาติ (32)


ความรู้เบื้องต้นเกี่ยวกับการพัฒนาคอมพิวเตอร์

Sanjeev Kumar , Peter J. Bentley , ใน On Growth, Form and Computers , 2003

ความแตกต่างของเซลล์

การเปลี่ยนแปลงของเซลล์ กระบวนการที่สี่ เป็นกระบวนการที่ค่อยเป็นค่อยไปโดยที่เซลล์ได้รับโครงสร้างและการทำงานที่แตกต่างจากกัน ส่งผลให้เกิดเซลล์ชนิดต่างๆ ที่แตกต่างกันออกไป เช่น เซลล์ประสาทหรือเซลล์ผิวหนัง ดิฟเฟอเรนติเอชันเป็นพื้นฐานเกี่ยวกับโปรตีนต่างๆ ที่เซลล์มีอยู่หากเซลล์มีความแตกต่างในระยะสุดท้าย เซลล์จะยังคงผลิตโปรตีนเหล่านี้ต่อไปเนื่องจากการเปลี่ยนแปลงในการแสดงออกของยีนที่ทำให้เกิดรูปแบบที่เสถียรของกิจกรรมของยีน มิฉะนั้น เซลล์อาจยังคงสร้างความแตกต่างต่อไปตามการแบ่งเซลล์ที่ต่อเนื่องกัน ดังนั้นการสร้างความแตกต่างจึงได้รับอิทธิพลจากสองกระบวนการต่อไปนี้เป็นอย่างน้อย:

การส่งสัญญาณของเซลล์ - การสื่อสารระหว่างเซลล์และ

การหารแบบไม่สมมาตร – การหารที่ส่งผลให้เกิดการปันส่วนปัจจัย (โปรตีน) แบบอสมมาตรในเซลล์แม่ ทำให้เซลล์แม่และลูกได้รับชะตากรรมของพัฒนาการที่แตกต่างกัน มันยังทำหน้าที่เป็นกลไกการหักสมมาตร (ทัวริง, 1952 Wolpert, 1998 สจ๊วต, บทที่ 10 เล่มนี้).


แสดง/ซ่อนคำที่ควรรู้

ความแตกต่าง: เมื่อเซลล์เลือกเส้นทางที่กำหนดโดยพันธุกรรมเฉพาะ ซึ่งทำให้เซลล์ทำงานเฉพาะทางเพียงไม่กี่อย่าง มากกว่า

DNA (กรดดีออกซีไรโบนิวคลีอิก): คำสั่งระดับโมเลกุลที่ชี้แนะว่าสิ่งมีชีวิตทั้งหมดพัฒนาและทำงานอย่างไร มากกว่า

ไข่: เซลล์สืบพันธุ์เพศหญิงซึ่งเก็บทุกส่วนของเซลล์หลังจากหลอมรวมกับสเปิร์ม

เกม: เซลล์พิเศษที่พบในอวัยวะสืบพันธุ์ของคุณซึ่งมีปริมาณ DNA ครึ่งหนึ่งของเซลล์โซมาติก เซลล์เหล่านี้รวมกันเพื่อสร้างไข่ที่ปฏิสนธิ มากกว่า

ยีน: ขอบเขตของ DNA ที่สั่งการให้เซลล์สร้างโปรตีน ในฐานะมนุษย์ คุณมักจะได้รับชุดคำสั่งจากแม่และอีกชุดหนึ่งจากพ่อของคุณ มากกว่า

นิวเคลียส: โดยที่ DNA อยู่ในเซลล์ พหูพจน์คือนิวเคลียส

สิ่งมีชีวิต: สิ่งมีชีวิตที่สามารถมีขนาดเล็กเหมือนแบคทีเรียหรือใหญ่เหมือนช้าง

เซลล์โซมาติก: เซลล์ในร่างกายของคุณ ยกเว้นเซลล์สืบพันธุ์ โสมเป็นภาษาละตินสำหรับร่างกาย

สเปิร์ม: เซลล์สืบพันธุ์เพศผู้ซึ่งถ่ายทอด DNA ของมันไปยังไข่เท่านั้น มากกว่า


เชิงนามธรรม

Ein Vergleich der neutralen genetischen Differenzierung und genetischen Diversität zwischen ziehenden และ sesshaften ประชากรอินเดียเนอร์goldhähnchens ( เรกูลัส สาตราปะ )

Viele Tierarten ziehen saisonbedingt zwischen Brut- und Nichtbrutgebieten Diese jährlichen Wanderungen können wesentliche Auswirkungen auf die genetische โครงสร้างกลุ่มประชากร Wir genotypisierten 281 Individuen aus elf Populationen anhand sieben verschiedener Mikrosatelliten-Loci, um die Muster der Neutralen genetischen Differenzierung und der genetischen Diversität zwischen ziehenden und sesshaften ประชากรเรกูลัส สาตราปะ), einer weitverbreiteten nordamerikanischen Singvogelart, zu vergleichen. Davon ausgehend, dass das Zugverhalten den Genfluss verstärkt, trafen wir die Vorhersage, dass sesshafte Populationen eine größere genetische Differenzierung und geringere genetische Diversität als zieufulation ประชากร Das Ausmaß der genetischen Differenzierung und der genetischen Diversität zwischen ziehenden และ sesshaften ประชากรในสงคราม vergleichbar. Die größte Differenzierung wurde beim Paarvergleich zwischen der Population in der Provinz Ontario และ allen westlichen Populationen festgestellt. Distanzbasierte Redundanz-Modelle และ Redundanz-Modelle zeigten, dass die Muster der neutralen genetischen Differenzierung und der neutralen genetischen Diversität einem „Isolation-durch-Distanz “ Modell (eng. Isolation-by-distenchthal model) ต้นแบบ Generell scheint es so, dass die genetischen Muster mit der eiszeitlichen Geschichte im Pleistozän zusammenhängen, wie es bereits in einer vorherigen ศึกษาค้นคว้า vermutet wurde


รับทราบ

ขอขอบคุณ J. Lyons, S. Barribeau, E. Sternberg และ A. Mongue สำหรับการสนทนาและการสนับสนุนทางเทคนิคในช่วงเริ่มต้นของโครงการนี้ M. Maudsley, B. Ballister, D. Cook, R. Rarick, E. Osburn, R Bartel, E. Rendon, D. Frey และ R. Obregon เพื่อขอความช่วยเหลือเกี่ยวกับการรวบรวมภาคสนามและห้องปฏิบัติการ De Roode และ L. Morran สำหรับความคิดเห็นที่เป็นประโยชน์เกี่ยวกับต้นฉบับเวอร์ชันก่อนหน้า

งบลงทุน

เอ.เอ.พี. ได้รับการสนับสนุนโดย NIH ทุนการฝึกอบรมหมายเลข 5T32AI055404-10 (ล. เรียล, PI) J.C.d.R. ได้รับการสนับสนุนโดย NSF ให้หมายเลข DEB-1019746 และ DEB-1257160 J.F.H. ได้รับการสนับสนุนจาก Fundación Migres M.R.K. ได้รับการสนับสนุนโดย NSF เงินช่วยเหลือหมายเลข DEB-1316037 และ S.A. ได้รับการสนับสนุนจาก NSF no. ให้เลขที่ DEB-0643831 .


วัสดุและวิธีการ

การวัดความแตกต่างทางพันธุกรรมระหว่างประชากร

NSเซนต์ คือการวัดความแตกต่างทางพันธุกรรมของประชากรที่หาปริมาณสัดส่วนของความแปรปรวนในความถี่อัลลีลระหว่างประชากรที่สัมพันธ์กับความแปรปรวนทั้งหมด (ผลรวมของความแปรปรวนภายในบุคคล ภายในประชากร และระหว่างประชากร) ตัวประมาณค่าต่างๆ ของ NSเซนต์ ได้รับการเสนอตลอดหลายปีที่ผ่านมา (ทบทวนใน Weir and Hill 2002 Holsinger and Weir 2009)

มีการถกเถียงกันอย่างมากเกี่ยวกับคำจำกัดความของ NSเซนต์. นักวิจัยบางคนพิจารณา NSเซนต์ เป็นพารามิเตอร์โมเดล (เช่น., หัวล้านและนิโคลส์ 1995 Nicholson และคณะ 2002 Holsinger และคณะ 2545) ในขณะที่คนอื่น ๆ มองว่าเป็นสถิติ (เช่น., Reynolds และคณะ 1983 ฝายและค็อกเกอร์แฮม 1984 ฮัดสัน และคณะ พ.ศ. 2535) แม้จะพิจารณาแล้ว NSเซนต์ เป็นพารามิเตอร์ มีการอภิปรายกันมากเกี่ยวกับรูปแบบที่เป็นพารามิเตอร์และวิธีที่ควรจะประมาณ (Marchini และ Cardon 2002 Balding 2003) บทความนี้ไม่ได้มีวัตถุประสงค์เพื่อเปรียบเทียบวิธีการเหล่านี้ ซึ่งแตกต่างกันทั้งในสิ่งที่ประเมินและวิธีการทำงานของกระบวนการประมาณการ เรายังคงไม่เชื่อเรื่องพระเจ้าเกี่ยวกับการอภิปรายเรื่องการตีความและคำจำกัดความของ NSเซนต์แม้ว่าเราจะใช้คำว่า "ตัวประมาณ" ตลอด แต่เราแสดงให้เห็นว่าตัวประมาณที่ใช้บ่อยที่สุดของ NSเซนต์ สามารถแก้ไขได้เมื่อมีข้อมูลที่มีความครอบคลุมต่ำและปานกลางเพื่อให้สะท้อนถึงสิ่งที่เป็นต้นฉบับได้แม่นยำยิ่งขึ้น NSเซนต์ ตัวประมาณการมีวัตถุประสงค์เพื่อจับ เช่น.วัตถุประสงค์คือเพื่อให้ได้มาซึ่งตัวประมาณที่ใช้กับข้อมูล NGS ซึ่งให้ผลลัพธ์ที่คล้ายกับที่ได้จากตัวประมาณเดิมโดยอิงจากข้อมูลจีโนไทป์ทั้งหมดโดยไม่มีข้อผิดพลาด โปรดทราบว่า ตัวประมาณค่าอื่นๆ ซึ่งไม่ได้พิจารณาในที่นี้ อาจแก้ไขในลักษณะเดียวกันได้

การประมาณค่าเมธอดของช่วงเวลา:

เราเริ่มต้นด้วยการพิจารณาวิธีการประมาณช่วงเวลาที่ง่ายที่สุดของ NSเซนต์. พวกเขาไม่ได้อาศัยสมมติฐานใดๆ เกี่ยวกับรูปร่างของการแจกแจงการสุ่มตัวอย่าง นอกเหนือจากช่วงเวลาที่ใช้ในการประมาณค่าพารามิเตอร์ และง่ายต่อการนำไปใช้ผ่านนิพจน์พีชคณิตอย่างง่าย ด้วยเหตุผลเหล่านี้ ตัวประมาณวิธีการของช่วงเวลาจึงเป็นที่นิยมและมักใช้

เป้าหมายแรกของเราคือการขยายวิธีการของช่วงเวลา NSเซนต์ ประมาณการที่เสนอโดย Reynolds และคณะ (1983) เนื่องจากเป็นหนึ่งในตัวประมาณการที่ได้รับความนิยมและมีแรงจูงใจมากที่สุดของ NSเซนต์, เพื่อคำนึงถึงความไม่แน่นอนของจีโนไทป์ สมมติว่า SNP แบบไบอัลเลลิก โดยมีอัลลีลที่ไม่อ้างอิงที่ความถี่โดยประมาณของ , , และสำหรับประชากร ผม, NSและรวมความแปรปรวนทางพันธุกรรมระหว่างและภายในประชากรที่ไซต์ NS คือ (1) และ (2) โดยที่ NSผม และ NSNS คือจำนวนบุคคลที่สุ่มตัวอย่างต่อประชากร , และ . ตารางที่ 1 อธิบายการตั้งชื่อที่ใช้ตลอดทั้งต้นฉบับนี้

ค่าประมาณของ NSเซนต์ สำหรับไซต์เดียวนั้น (3) ในขณะที่สำหรับa โลคัส ของ NS เว็บไซต์มันเป็น

การประมาณความน่าจะเป็นสูงสุด:

วิธี ML สำหรับการประมาณค่า NSเซนต์ ต้องการข้อกำหนดของการแจกแจงความน่าจะเป็นของการสุ่มตัวอย่าง เมื่อกำหนดการกระจายนี้แล้ว เราสามารถเพิ่มฟังก์ชันความน่าจะเป็นให้ได้มากที่สุดเพื่อรับตัวประมาณ ML สำหรับพารามิเตอร์ของการแจกแจง ตัวประมาณ ML ของ NSเซนต์ ได้รับความนิยมอย่างมาก โดยเฉพาะอย่างยิ่งสำหรับการตรวจจับลายเซ็นของการคัดเลือกโดยธรรมชาติที่ปรับตัวได้ระหว่างประชากร (เช่น., Beaumont and Balding 2004 รีเบลอร์ และคณะ 2008 Foll และ Gaggiotti 2008)

สมมติว่าเป็นไซต์สองฝ่าย NS ด้วยความถี่อัลลีลแบบกระจายเบต้า ความน่าจะเป็นของความถี่อัลลีลตัวอย่างที่ประชากร ผม สามารถแสดงเป็นการแจกแจงแบบเบตา-ทวินามด้วยพารามิเตอร์2NSผม (ขนาดตัวอย่าง), NSเซนต์, และ NSanc,NS, ความถี่อัลลีลของประชากรบรรพบุรุษ. การกำหนดพารามิเตอร์นี้สันนิษฐานว่ามีความแตกต่างจากประชากรบรรพบุรุษร่วมกัน และความแตกต่างที่ตามมานั้นมีการสร้างแบบจำลองที่ดีโดยการแจกแจงแบบเบตา การกระจายตัวอยจางชายขอบในประชากร ผม มอบให้โดย (Balding and Nichols 1995 Balding 2003) (5) โดยที่ k คือจำนวนอัลลีลที่ไม่อ้างอิง (หรือได้รับมา) NS เป็นฟังก์ชันเบต้า (6) และ

ฟังก์ชันความน่าจะเป็นเต็มเป็นผลคูณของการกระจายตัวอย่างนี้สำหรับประชากรทั้งหมด เนื่องจากประชากรมีเงื่อนไขอิสระบน NSanc,NS. สำหรับสองประชากร ผม และ NSเรามี (8) ที่ตัวห้อยบน NS และระบุอัตลักษณ์ของประชากร เราหาสมการที่ 8 ให้ได้มากที่สุดโดยใช้อัลกอริทึม Broyden–Fletcher–Goldfarb–Shanno (BFGS) (Fletcher 1987 Press และคณะ 2007).

การหาปริมาณความแตกต่างทางพันธุกรรมของประชากรโดยการเรียกจีโนไทป์

กลยุทธ์ที่ไร้เดียงสาสำหรับการประมาณความถี่อัลลีลตัวอย่างและ NSเซนต์ คือการเรียกจีโนไทป์ในแต่ละไซต์ก่อน จากนั้นจึงนับการเกิดขึ้นของอัลลีลที่ไม่อ้างอิงหรืออัลลีลที่ได้รับจากบุคคลทั้งหมด

อันดับแรก เราประเมินความถูกต้องของกลยุทธ์การเรียกจีโนไทป์หลายอย่าง (ข้อมูลสนับสนุน ไฟล์ S1) วิธีการเหล่านี้รวมถึงแนวทางที่อิงจากการนับฐานการอ่านโดยตรง บนความน่าจะเป็นของยีน และความน่าจะเป็นหลังของยีน แนวทางหนึ่งที่มีแนวโน้มว่าจะใช้วิธี Bayesian เพื่อกำหนดจีโนไทป์แต่ละรายการโดยการคำนวณความน่าจะเป็นหลังของจีโนไทป์ NS(NS|NS) จากความน่าจะเป็นของจีโนไทป์และก่อนหน้าที่เฉพาะเจาะจง NS(NS) บนจีโนไทป์ NS. ทฤษฎีบทของเบย์ใช้ในการคำนวณ NS(NS|NS) ความน่าจะเป็นหลังของจีโนไทป์ NS จากข้อมูลที่สังเกตได้ NS (1000 Genomes Project Consortium 2010). ค่าก่อนหน้านี้สามารถกำหนดได้โดยใช้ข้อมูลภายนอก เช่น ลำดับอ้างอิง ลำดับในฐานข้อมูล การประมาณความถี่ของอัลลีล และ/หรือสัมประสิทธิ์การผสมข้ามพันธุ์ เป็นต้น (เช่น., 1000 Genomes Project Consortium 2010 Li 2011 Nielsen และคณะ 2012).

ผลลัพธ์แสดงว่าการเรียกจีโนไทป์จากความน่าจะเป็นหลังของจีโนไทป์ให้จีโนไทป์ที่เสถียรและแม่นยำที่สุดและความแม่นยำในการเรียก SNP ในสถานการณ์การทดลองที่ทดสอบเกือบทั้งหมด (ตาราง S1, ตาราง S2 และตาราง S3) เราใช้กลยุทธ์นี้เพื่อเรียกจีโนไทป์ตลอดการศึกษาที่เหลือ โดยเฉพาะอย่างยิ่ง เรานับอัลลีลที่ไม่อ้างอิงจากยีนที่เรียกว่าจีโนไทป์เหล่านี้เพื่ออนุมานความถี่อัลลีลและคำนวณตัวประมาณวิธีการช่วงเวลาของ NSเซนต์ซึ่งเรากำหนดไว้ (สมการที่ 10 และ 11) เราใช้กลยุทธ์การเรียกจีโนไทป์นี้เพื่อคำนวณตัวประมาณ ML ของ NSเซนต์, (สมการ 5 และ 8)

กลยุทธ์ทางเลือกสำหรับการคำนวณ NSเซนต์ คือการหลีกเลี่ยงการเรียกจีโนไทป์ทั้งหมดเพื่อให้การอนุมานอยู่บนพื้นฐานของความน่าจะเป็นหลังโดยตรง (เช่น., ยี่ และคณะ 2010 Nielsen และคณะ 2555). เราอธิบายวิธีการดังกล่าวในส่วนต่อไปนี้

การหาปริมาณความแตกต่างทางพันธุกรรมของประชากรโดยไม่ต้องเรียกจีโนไทป์

เราขอเสนอให้ใช้กรอบความน่าจะเป็นแบบเบย์ในการประมาณค่า NSเซนต์ จากความน่าจะเป็นภายหลังของความถี่อัลลีลตัวอย่างของประชากรแต่ละกลุ่มในแต่ละไซต์โดยไม่ต้องเรียกจีโนไทป์เฉพาะ ในแอปพลิเคชันของเรา เราคำนวณค่าประมาณความน่าจะเป็นสูงสุดของสเปกตรัมความถี่ไซต์จากความน่าจะเป็นของจีโนไทป์ ตามที่ Nielsen เสนอก่อนหน้านี้ และคณะ (2012). การใช้ค่าประมาณ ML ของ SFS นี้เป็นวิธีก่อนหน้านี้ในแนวทาง Bayes เชิงประจักษ์ เราประมาณความน่าจะเป็นภายหลังสำหรับความถี่อัลลีลที่เป็นไปได้ทั้งหมดในแต่ละไซต์ (Nielsen และคณะ 2012).

การประมาณค่าเมธอดของช่วงเวลา:

อนุญาต เป็นความน่าจะเป็นหลังที่ไซต์ในประชากร ผม ได้รับความถี่อัลลีลตัวอย่าง ในกลุ่มตัวอย่างของ NSผม บุคคลที่ซ้ำโดยได้รับข้อมูลการอ่าน Y(ผม,NS). ความน่าจะเป็นนี้สามารถคำนวณได้จากความน่าจะเป็นของจีโนไทป์โดยใช้อัลกอริทึมใน Nielsen และคณะ (2012). การติดฉลากอัลลีลที่เกี่ยวกับอัลลีลที่ได้รับนั้นเป็นไปตามอำเภอใจ และสามารถเลือกการติดฉลากอัลลีลอื่น ๆ ได้ หากไม่สามารถระบุตัวตนของบรรพบุรุษและสถานะที่ได้รับได้

จากปริมาณเหล่านี้ เราคำนวณความคาดหวังภายหลังของความแปรปรวนทางพันธุกรรมระหว่างและภายในประชากร (ดูสมการที่ 1 และ 2) ที่ไซต์ NS เป็น (10) และ (11) ที่และความแปรปรวนทางพันธุกรรมจาก Reynolds และคณะ (1983) สูตรด้วย k- และ z- ได้อัลลีลในกลุ่มประชากร ผม และ NS, ตามลำดับ, และ YNS เป็นข้อมูลลำดับที่ไซต์ NS. ผลต่างที่คาดหวังทั้งหมด อี[NS|YNS] ในแต่ละไซต์แล้ว อี[NS|YNS] = อี[NSNS|YNS] + อี[NSNS|YNS].

ค่าประมาณของ NSเซนต์ สำหรับไซต์เดียวจะได้รับตามอัตราส่วนของ อี[NSNS|YNS] ถึง อี[NS|YNS] (สมการ 3). อย่างไรก็ตาม เนื่องจากองค์ประกอบความแปรปรวนทั้งสองไม่เป็นอิสระต่อกัน และการคำนวณนี้เกี่ยวข้องกับการคาดหวังอัตราส่วน เราจึงประมาณโดยใช้วิธีเดลต้า (Rice 2008 Rice และ Papadopoulos 2009) เพื่อให้ได้ค่าประมาณต่อไปนี้ NSเซนต์ ที่ไซต์ NS, (12) โดยที่ 〈ยู> คือ ยูช่วงเวลากลางของ NS และ <NS, ยู〉 คือโมเมนต์ศูนย์กลางแบบผสม ซึ่งสามารถคำนวณได้เป็น (13) และ (14) โดยที่ความแปรปรวนทางพันธุกรรมทั้งหมดจากเรย์โนลด์ส และคณะ (1983) สูตรด้วย k- และ z- ได้อัลลีลในกลุ่มประชากร ผม และ NSตามลำดับ สำหรับวัตถุประสงค์ในการคำนวณ เราใช้เฉพาะช่วงเวลากลางแรกและช่วงกลางแบบผสมเท่านั้น

สามารถคำนวณได้โดยใช้ความน่าจะเป็นสูงสุดเช่นเดียวกับวิธีคำนวณประชากรเดี่ยว (Nielsen และคณะ 2555). อย่างไรก็ตาม การคำนวณนี้อาจไม่เป็นที่ต้องการเนื่องจากความแปรปรวนสูงที่เกี่ยวข้องกับการประมาณค่าพารามิเตอร์จำนวนมาก

อีกวิธีหนึ่งคือการคำนวณค่าประมาณของสเปกตรัมความถี่ไซต์สองมิติ (2D-SFS) เช่น (15) โดยที่และมีความเป็นไปได้เล็กน้อยที่จะสังเกต k และ z อัลลีลที่ไม่อ้างอิงที่ประชากร ผม และ NS, ตามลำดับ, ที่ไซต์ NSตามที่นำเสนอใน Nielsen และคณะ (2012).

จะใช้เป็นค่าก่อนหน้าในการคำนวณความน่าจะเป็นภายหลังของปริมาณดอกเบี้ย ตัวอย่างเช่น ความคาดหวังของความแปรปรวนทางพันธุกรรมระหว่างประชากร (ดูสมการที่ 10) สามารถคำนวณได้เป็น (16) สุดท้าย ตัวประมาณวิธีช่วงเวลาของ NSเซนต์ เกิน NS ไซต์ถูกกำหนดโดยสมการที่ 4 เมื่อวิเคราะห์ไซต์หลายแห่ง เราจะไม่เพิ่มตัวประกอบการแก้ไขลงในอัตราส่วนของ อี[NS|NS] ถึง อี[|NS] ในแต่ละไซต์ เนื่องจากสำหรับไซต์จำนวนมาก ข้อผิดพลาดที่เกิดจากการใช้อัตราส่วนของความคาดหวังที่ไม่เป็นอิสระสองครั้งจะน้อยที่สุด เรายังทดสอบประสิทธิภาพของวิธีการอื่นๆ ในการประมาณค่า NSเซนต์ จากข้อมูลการจัดลำดับที่ได้มาจากความคาดหวังของความถี่อัลลีลตัวอย่าง (ไฟล์ S1)

วิธีการเหล่านี้สามารถขยายไปสู่คำจำกัดความที่ไม่ใช่คู่ของ NSเซนต์ (เวียร์ 2539). สูตรเหล่านี้ต้องการการประมาณค่า SFS ร่วมระหว่างประชากรทั้งหมด ซึ่งสามารถประมาณได้ในลักษณะที่คล้ายคลึงกันในสมการที่ 15

การประมาณความน่าจะเป็นสูงสุด:

นอกจากนี้เรายังขยายขั้นตอนการประมาณค่า ML ของ NSเซนต์ และ NSanc ภายใต้การแจกแจงแบบเบตา-ทวินาม (Balding and Nichols 1995 Balding 2003) (สมการที่ 8) กับกรณีที่ไม่ทราบจีโนไทป์ ค่าประมาณเหล่านี้ซึ่งเราเรียกว่า NSST.MLได้มาจากการเพิ่มฟังก์ชันความน่าจะเป็นสูงสุด (17) โดยที่ Y(ผม,NS) และ Y(NS,NS) เป็นข้อมูลการอ่านที่สังเกตได้ที่ไซต์ NS เพื่อประชาชน ผม และ NS, ตามลำดับ, และ และอีกครั้งคือความน่าจะเป็นส่วนเพิ่มของความถี่อัลลีลตัวอย่างสำหรับประชากร ผม และ NSคำนวณเหมือนใน Nielsen และคณะ (2012).

การวิเคราะห์องค์ประกอบหลัก

แนวทางที่คล้ายคลึงกันกับแนวทางที่ใช้ในการแก้ไขค่าประมาณของ NSเซนต์ สามารถใช้ใน PCA วิธีการคำนวณ PCA ที่เป็นมาตรฐานในปัจจุบันในพันธุศาสตร์ของประชากรนั้นขึ้นอยู่กับ Patterson และคณะ (2006). สำหรับ NS บุคคลและ NS ไซต์เมทริกซ์ความแปรปรวนร่วมที่ทำให้เป็นมาตรฐาน คำนวณเป็น (18) โดยที่ความถี่อัลลีลที่ได้รับที่ไซต์ NS (การติดฉลากเป็นไปตามอำเภอใจอีกครั้ง) และ NS(w,NS) คือจำนวนอัลลีลที่ได้รับสำหรับแต่ละบุคคล w ที่ไซต์ NS (NS ∈ <0, 1, 2>ในกรณีดิพลอยด์) ตัวส่วนถูกแทรกเพื่ออธิบายความเบี่ยงเบนทางพันธุกรรมและปรับความถี่อัลลีลมาตรฐานให้เป็นมาตรฐานเพื่อให้มีความแปรปรวนเท่ากัน (แพตเตอร์สัน และคณะ 2549). อย่างไรก็ตาม สามารถเลือกการทำให้เป็นมาตรฐานอื่นๆ ได้ การสลายตัวของเวกเตอร์ไอเกนเวคเตอร์ของ จะถูกคำนวณแล้ว

นอกจากนี้ เมทริกซ์จะถ่วงน้ำหนักโดยความน่าจะเป็นของแต่ละไซต์ที่เป็นตัวแปร สิ่งนี้ได้รับแรงจูงใจจากข้อเท็จจริงที่ว่า ไซต์ที่มีความน่าจะเป็นเพียงเล็กน้อยที่จะแปรผันในตัวอย่างสามารถมีส่วนสนับสนุนเล็กน้อยในเมทริกซ์ที่มีการจัดลำดับต่ำถึงปานกลาง . เนื่องจากพวกมันมีขนาดไม่คงที่มากกว่าไซต์ที่แปรผันได้หลายขนาด จึงอาจส่งผลกระทบอย่างลึกซึ้งต่อการวิเคราะห์ แม้ว่าจะทำการถ่วงน้ำหนักด้วยความน่าจะเป็นของจีโนไทป์ แทนที่จะใช้การเรียก SNP แบบแยกส่วนหรือความถี่อัลลีลเล็กน้อย การตัดออก เราเสนอไซต์การถ่วงน้ำหนักตามความน่าจะเป็นที่จะแปรผัน

ดังนั้นเราจึงประมาณเมทริกซ์ ส่วน wy) (19) โดยที่ความน่าจะเป็นของไซต์ NS เป็นตัวแปร NSวาร์NSคำนวณเป็น (20) เราเน้นว่าวิธีนี้ไม่ได้ให้รูปแบบของการวิเคราะห์ PCA แบบเบย์ แต่เป็นการปรับเปลี่ยน Patterson และคณะ แนวทางสำหรับการวิเคราะห์ PCA (2006) ในบริบทของพันธุศาสตร์ของประชากร ปรับเปลี่ยนเพื่อรวมความไม่แน่นอนในการเรียกจีโนไทป์โดยใช้น้ำหนักที่เหมาะสมของจีโนไทป์ที่แตกต่างกันโดยใช้ความน่าจะเป็นส่วนหลังตามลำดับ

เรายังทราบด้วยว่า (21) สำหรับบุคคลที่ไม่เกี่ยวข้องภายใต้ HWE โดยสมมติความถี่อัลลีลที่รู้จักและได้มาจาก HWE ก่อนสำหรับความน่าจะเป็นของยีน นี่แสดงให้เห็นว่าฟังก์ชันความแปรปรวนร่วมสำหรับบุคคลที่ไม่เกี่ยวข้องกันนั้น แท้จริงแล้วคาดว่าจะเป็นศูนย์โดยใช้ตัวประมาณนี้ ซึ่งเป็นคุณสมบัติที่จำเป็นและพึงประสงค์สำหรับวิธีการที่จะทำงานได้ดี หลักฐานของสมการที่ 21 มีอยู่ใน ภาคผนวก. ในขณะที่เราโต้แย้ง PCA ที่เป็นผลลัพธ์นั้นได้รับการปรับปรุงอย่างมากเมื่อเทียบกับวิธีการไร้เดียงสาโดยใช้การเรียกจีโนไทป์ภายใต้สถานการณ์ที่สำรวจทั้งหมด

วิธีการนี้สามารถขยายไปสู่กลยุทธ์ต่างๆ เพื่อดำเนินการ PCA จากเมทริกซ์ของความน่าจะเป็นหลังของจีโนไทป์ เช่น วิธี ML ที่พิจารณาการมีส่วนร่วมของสัญญาณรบกวนของแต่ละตัวแปร (Wentzell และคณะ 1997) หรือวิธี Bayesian ที่ใช้ข้อมูลภายนอกเกี่ยวกับข้อมูล (Nounou และคณะ 2002).

การจำลองข้อมูลการจัดลำดับสำหรับประชากรหลายกลุ่ม

เราทำการจำลองเพื่อเปรียบเทียบประสิทธิภาพของวิธีการเหล่านี้เพื่อประเมินความแตกต่างทางพันธุกรรมของประชากร ตลอดจนการหาปริมาณของจีโนไทป์และความแม่นยำในการเรียก SNP ภายใต้เงื่อนไขการทดลองที่หลากหลาย เช่นเดียวกับในการศึกษาก่อนหน้านี้ (Kim และคณะ 2010, 2011) เราจำลองข้อมูลการจัดลำดับมากกว่าการอ่านการเรียงลำดับแบบดิบเพื่อประสิทธิภาพในการคำนวณเราถือว่าไซต์ต่างๆ เป็นอิสระจากกัน และจำลองจีโนไทป์สำหรับแต่ละบุคคลโดยถือว่า HWE และความถี่อัลลีลของประชากรเฉพาะ โดยเฉพาะอย่างยิ่ง เราได้ทำซ้ำขั้นตอนต่อไปนี้สำหรับแต่ละไซต์

อันดับแรก สำหรับแต่ละไซต์ เราวาดความถี่อัลลีลของบรรพบุรุษ NSanc จากการแจกแจงใน [5 × 10 −3 , 1 − (5 × 10 −3 )] โดยมีสัดส่วนความหนาแน่นเป็น 1/NS. การแจกแจงนี้เป็นการแจกแจงความถี่อัลลีลที่คาดหวังภายใต้แบบจำลองไซต์อนันต์ที่เป็นกลางแบบมาตรฐาน ซึ่งตัดทอนที่ขอบเขตที่สอดคล้องกับขนาดประชากร 200 คน (ดู เช่น., อีเวนส์ 2004). จากนั้นเราจำลองความถี่อัลลีลสำหรับประชากรสองกลุ่มโดยใช้แบบจำลอง Balding–Nichols (Balding และ Nichols 1995) โดยมีค่าเฉลี่ยเท่ากับ NSancเช่นเดียวกับในการศึกษาก่อนหน้านี้ (Pritchard and Donnelly 2001 Price และคณะ 2549). เราจำลองตัวอย่างอิสระสองตัวอย่าง ตามเงื่อนไขบน NSเซนต์ และ NSancจากการแจกแจงนี้เพื่อให้ได้ความถี่อัลลีลสำหรับสองประชากร (ดูสมการที่ 5) จากความถี่อัลลีลของประชากรเหล่านี้ เรากำหนดจีโนไทป์ตาม HWE สำหรับแต่ละบุคคล

ในการจำลองข้อมูลจากประชากรสามกลุ่ม อันดับแรก เราดึงความถี่อัลลีลของประชากรจากแบบจำลอง Balding–Nichols สำหรับประชากรสองกลุ่มดังที่อธิบายไว้ข้างต้น จากนั้นเรากำหนดความถี่อัลลีลแรกให้กับประชากร 1 และใช้ความถี่อัลลีลที่สองเป็นความถี่อัลลีลบรรพบุรุษสำหรับประชากร 2 และ 3 จากนั้นเราดึงความถี่อัลลีลประชากรสองความถี่จากแบบจำลอง Balding–Nichols สำหรับค่าที่ต่างกันของ NSเซนต์ และกำหนดความถี่อัลลีลเหล่านี้ให้กับประชากร 2 และ 3

ในการจำลองข้อมูล NGS จำนวนการอ่านในแต่ละสถานที่สำหรับแต่ละบุคคลถูกจำลองจากการแจกแจงแบบปัวซองเช่นเดียวกับใน Kim และคณะ (2010, 2011). นอกจากนี้ ข้อผิดพลาดถูกสุ่มเลือกอย่างเท่าเทียมกันระหว่างนิวคลีโอไทด์ที่อัตรา 0.0075 ค่านี้เทียบได้กับอัตราความผิดพลาดที่พบในการศึกษาก่อนหน้า (1000 Genomes Project Consortium 2010 Li และคณะ 2010 ยี่ และคณะ 2553). ความน่าจะเป็นของไซต์ที่มีหลายรูปแบบ NSvar, เปลี่ยนแปลงจาก 0.02 เป็น 1

เราคำนวณความน่าจะเป็นของจีโนไทป์จากการอ่านลำดับจำลอง ความเป็นไปได้ของจีโนไทป์ขึ้นอยู่กับทั้งการเรียกฐานและคะแนนคุณภาพและเป็นสัดส่วนกับความน่าจะเป็น NS(NS|NS) ของข้อมูลการอ่านที่สังเกตได้ NSที่ไซต์สำหรับแต่ละบุคคลที่ได้รับจีโนไทป์ที่แน่นอน NS. ในกรณีที่ง่ายที่สุดสำหรับ read z ที่ไซต์ NSเราคำนวณความน่าจะเป็นของจีโนไทป์ของฐานเฉพาะ วี, หลี่(z,วี,NS) กับ วีเช่น หลี่(z,วี,NS) = (1 − อี) ถ้า วี เป็นฐานที่สังเกตได้ที่ read z, และ หลี่(z,วี,NS) = อี/3 อย่างอื่น. ที่นี่ อี คือข้อผิดพลาดในการจัดลำดับที่ใช้ในการตั้งค่าการจำลอง มีหลายวิธีในการประมาณค่า อีรวมทั้งวิธีการประมาณค่าโดยตรงจากข้อมูล (เช่น., คิม และคณะ 2554). โอกาสของยีนที่ไซต์ NS สำหรับบุคคล w แล้วคำนวณโดยหาผลคูณของความน่าจะเป็นมาทั้งหมด NS อ่าน: (22) โดยใช้ขั้นตอนนี้ เราคำนวณความน่าจะเป็นของยีนสำหรับแต่ละบุคคลในแต่ละไซต์สำหรับทั้ง 10 ยีนที่เป็นไปได้ จากนั้นเราคำนวณความน่าจะเป็นหลังของจีโนไทป์และความถี่อัลลีลตัวอย่างตามที่อธิบายไว้ก่อนหน้านี้ (ดูสมการที่ 9)

เมื่อเรียกใช้จีโนไทป์ เราได้กำหนดจีโนไทป์ที่มีความน่าจะเป็นภายหลัง <0.90 เป็นข้อมูลที่ขาดหายไป เราลบไซต์ที่มีบุคคลมากกว่าครึ่งที่ไม่มีจีโนไทป์ ด้วยขั้นตอนนี้ เรากรอง ∼25% ของไซต์ทั้งหมดที่ครอบคลุมการเรียงลำดับ 2 เท่า เราคำนวณ NSเซนต์ เฉพาะในจีโนไทป์ที่ไม่หายไป ในขณะที่สำหรับ PCA เราระบุข้อมูลที่ขาดหายไปด้วยจีโนไทป์ที่มีความน่าจะเป็นหลังสูงสุด

เพื่อประเมินความถูกต้องของการประมาณการต่อไซต์ของ NSเซนต์เราจำลองชุดข้อมูล 10k และ 1k สองชุดสำหรับแต่ละสถานการณ์ทดลองเพื่อประเมินวิธีช่วงเวลาและการประมาณ ML ตามลำดับด้วย NSเซนต์ แตกต่างกันตั้งแต่ 0.01 ถึง 0.4 และด้วย NSvar = 1 เราตรวจสอบการบรรจบกันของอัลกอริธึมการปรับให้เหมาะสมสำหรับตัวประมาณ ML ของ NSเซนต์ และทิ้งไซต์ที่ไม่ตรงตามเงื่อนไขนี้ นอกจากนี้เรายังจำลองไซต์ 1M โดยการต่อ 100 ชุดของไซต์จำลอง 10k กับ NSเซนต์ ค่าที่ดึงมาจากการแจกแจงแบบปกติ NS(0.2, 0.2) ตัดทอนที่ 0.02 และ 0.90 และ NSvar = 0.10 เพื่อประเมินความถูกต้องของการประมาณการหลายไซต์ของ NSเซนต์. เราจำลองบุคคล 20 คนต่อประชากรที่ความครอบคลุมตามลำดับต่ำ (2×) ปานกลาง (6×) และสูง (20×)

เพื่อประเมินประสิทธิภาพของวิธีการต่าง ๆ ในการประมาณค่า NSเซนต์เราคำนวณค่าเบี่ยงเบนสองค่าจากค่า true NSเซนต์ เกิน NS ไซต์: ส่วนเบี่ยงเบน root-mean-square (RMSD), (23) และค่าเบี่ยงเบนเฉลี่ย (24) โดยที่และคือค่าประมาณ NSเซนต์ ที่ไซต์ NS จากกรณีของจีโนไทป์ที่ทราบและข้อมูลการจัดลำดับตามลำดับ

เพื่อประเมินความถูกต้องของวิธี PCA เราจำลองไซต์ 10k สำหรับแต่ละสถานการณ์ด้วยค่า NSเซนต์ ตั้งแต่ 0.02 ถึง 0.4 และด้วย NSvar = 0.02, 0.1 หรือ 1 เราจำลองประชากรสามกลุ่มโดยแต่ละกลุ่มมี 20 คนโดยครอบคลุมลำดับ 2×, 6× และ 20× เราทำการจำลอง 10 แบบสำหรับแต่ละเงื่อนไขการทดลองเพื่อให้มั่นใจว่าผลลัพธ์ของเรามีความทนทาน เราประเมินความถูกต้องของแปลง PCA ที่อนุมานโดยใช้การวิเคราะห์ Procrustes (Wang และคณะ 2553). โดยสังเขป เราวัดความเบี่ยงเบนของ PC1 และ PC2 ที่คำนวณจากกรณีของจีโนไทป์ที่รู้จักและกรณีของจีโนไทป์ที่ไม่รู้จักโดยใช้ผลรวมของกำลังสอง (SS) โดยที่ค่า SS ที่ใกล้กับ 0 บ่งชี้ว่าเหมาะสมกว่า

แอปพลิเคชันกับข้อมูลจริง

เราวิเคราะห์ชุดข้อมูลของหนอนไหมป่าและสายพันธุ์ที่เลี้ยงในบ้าน บี โมริ (เซียะ และคณะ 2552). ข้อมูลประกอบด้วยตัวอย่าง 40 ตัวอย่าง ซึ่งเป็นตัวแทนของเชื้อสายที่เลี้ยงในบ้าน 29 ตระกูล และเชื้อสายป่า 11 สายพันธุ์ เชื้อสายที่เลี้ยงในบ้านจะแยกตามฟีโนไทป์และตามภูมิศาสตร์ออกเป็นกลุ่มย่อย ในขณะที่เชื้อสายป่าทั้งหมดมาจากประเทศจีน ตัวอย่างถูกจัดลำดับที่ค่าเฉลี่ยโดยประมาณต่อพื้นที่ครอบคลุม 3 เท่า เราวิเคราะห์โครโมโซม 2 โดยใช้ความน่าจะเป็นของจีโนไทป์ดั้งเดิมโดยลบไซต์ที่เราไม่มีข้อมูลของบุคคลอย่างน้อยหนึ่งราย รายละเอียดเกี่ยวกับการคำนวณความน่าจะเป็นของยีนสามารถพบได้ในบทความต้นฉบับ (Xia และคณะ 2552). มีการวิเคราะห์ไซต์ทั้งหมดประมาณ 200,000 ไซต์

เราคำนวณความน่าจะเป็นหลังของความถี่อัลลีลตัวอย่างและจีโนไทป์โดยใช้ซอฟต์แวร์ ANGSD (มีอยู่ที่ http://www.popgen.dk/angsd) จากนั้นเราก็ทำการ PCA และประมาณการ NSเซนต์ โดยใช้วิธีใหม่ที่เสนอในชุดโปรแกรม C/C++ (มีให้ที่ https://github.com/mfumagalli/ngstools) การวิเคราะห์ทางสถิติทั้งหมดดำเนินการในสภาพแวดล้อม R (http://www.r-project.org)


หลักการวิวัฒนาการ นิเวศวิทยา และพฤติกรรม

บทที่ 1 บทนำ [00:00:00]

ศาสตราจารย์สตีเฟน สเติร์นส์: การบรรยายในวันนี้เกี่ยวกับวิวัฒนาการที่เป็นกลาง งั้นมาเริ่มกันเลยดีกว่า ฉันอยากเตือนคุณว่า เมื่อผู้คนคิดถึงวิวัฒนาการ พวกเขามักจะคิดว่ามันเป็นการคัดเลือกโดยธรรมชาติเท่านั้น แต่มันไม่ใช่ เป็นทั้งไมโครและมาโคร ดังนั้นมาโครจึงให้ประวัติศาสตร์และข้อจำกัดแก่เรา โดยพื้นฐานแล้วจุลภาคประกอบด้วยการคัดเลือกโดยธรรมชาติและการล่องลอย และชีววิทยาพัฒนาการก็มีส่วนเกี่ยวข้องทั้งสองอย่าง

ดังนั้นสิ่งที่เราจะพูดถึงในวันนี้ก็คือวิวัฒนาการที่เป็นกลาง จะเกิดอะไรขึ้นกับยีนหรือลักษณะที่ไม่ได้รับการคัดเลือกโดยธรรมชาติเนื่องจากไม่ได้สร้างความแตกต่างใดๆ ต่อความสำเร็จในการสืบพันธุ์ จริงๆ แล้วมีหลายอย่างที่เกิดขึ้น และมีประโยชน์อย่างมากที่มันทำ มันให้ข้อมูลพื้นฐานแก่เรา มันให้วิธีการวัดสิ่งต่างๆ แก่เรา และให้ข้อมูลมากมายเกี่ยวกับประวัติศาสตร์แก่เรา

ดังนั้นจะมีสามข้อความที่ฉันต้องการให้คุณจำวันนี้ หนึ่งเป็นไปได้ว่าไมโอซิสเป็นเหมือนเหรียญที่ยุติธรรม ความน่าจะเป็นที่ยีนจะเข้าสู่เซลล์สืบพันธุ์เฉพาะในไมโอซิสคือ 50% ประเด็นที่สองคือการที่การตรึงของอัลลีลที่เป็นกลางในประชากรนั้นเหมือนกับการสลายตัวของกัมมันตภาพรังสี และมันเหมือนกับในความหมายนี้: ไม่ว่าในกรณีของการตรึงอัลลีลที่เป็นกลาง หรือในกรณีของการพูดว่ากำลังดูกรัมของ ยูเรเนียม-238 คุณรู้หรือไม่ว่าการกลายพันธุ์ใดจะได้รับการแก้ไขหรืออะตอมใดจะสลายตัว แต่เนื่องจากมีหลายเหตุการณ์ ในทั้งสองกรณี คุณจึงทราบได้อย่างชัดเจนว่าจะมีเหตุการณ์เกิดขึ้นกี่เหตุการณ์ในช่วงเวลาหนึ่ง ตกลง?

นี่เป็นกฎประเภทหนึ่งที่มีจำนวนมากสำหรับเหตุการณ์สุ่ม หากมีเหตุการณ์สุ่มเกิดขึ้นมากมาย ค่าเฉลี่ยเป็นสิ่งที่คาดเดาได้มาก แต่ถ้าคุณตรวจสอบนิวคลีโอไทด์หนึ่งตัวในจีโนม หรือหนึ่งอะตอมในยูเรเนียมหนึ่งกรัม คุณจะไม่สามารถคาดเดาได้ว่าเมื่อใดที่มันจะกลายพันธุ์ เมื่อมันอาจได้รับการแก้ไข เมื่อมันสลายไป

สิ่งที่สามที่ผมอยากให้คุณจำไว้ก็คือการตรึงอัลลีลที่เป็นกลางอย่างสม่ำเสมอ ซึ่งเป็นกระบวนการที่คงที่ซึ่งถ้าคุณดูจีโนมทั้งหมดในช่วงเวลาที่กำหนด󈝶,000 ปี 100,000 ปี– เป็นสิ่งที่คาดเดาได้มาก โดยเฉลี่ย จำนวนการกลายพันธุ์จะได้รับการแก้ไขหากพวกมันเป็นกลาง ดังนั้นหากคุณสามารถระบุตำแหน่งที่เป็นกลางในจีโนมได้ คุณสามารถใช้พวกมันเพื่อประเมินความสัมพันธ์และเวลาของบรรพบุรุษร่วมกันคนสุดท้าย ตกลง?

จึงมีแนวคิดที่น่าสนใจ ค่อนข้างเป็นนามธรรม และค่อนข้างใหญ่ในการบรรยายนี้ ความบังเอิญไม่ใช่สิ่งที่ทุกคนคิดว่าเป็นสัญชาตญาณ เห็นได้ชัดว่าสมองของเราไม่ได้ออกแบบโดยการคัดเลือกโดยธรรมชาติเพื่อจัดการกับลาสเวกัสหรือตลาดหุ้นได้เป็นอย่างดี ตกลง? ดังนั้นเราจึงต้องปรับปรุงสัญชาตญาณของคุณเล็กน้อยเกี่ยวกับวิธีการทำงานของกระบวนการสุ่ม

อย่างไรก็ตาม คนที่ทำได้ดีในแคลคูลัสและการวิเคราะห์มักจะพบว่าการแนะนำความน่าจะเป็นและสถิติทำให้สับสนเล็กน้อย สิ่งที่เกิดขึ้นที่นี่คือคุณต้องเรียนรู้ที่จะคิดเกี่ยวกับประชากรทั้งหมดของสิ่งต่าง ๆ และเกี่ยวกับการแจกแจงและความถี่ของสิ่งต่าง ๆ มากกว่าที่จะเกี่ยวกับลูกบิลเลียดที่ชนกันบนโต๊ะหรือดาวเคราะห์ที่ถูกดึงดูดเข้าหาดวงอาทิตย์โดยแรงโน้มถ่วง . มันเป็นความคิดที่แตกต่างออกไป มันคือความคิดของประชากร

ดังนั้นโครงร่างของการบรรยายจึงเป็นเพียงเล็กน้อยเกี่ยวกับความเป็นกลางที่เกิดขึ้น ฉันต้องการให้คุณรู้อย่างกลไกว่าทำไมยีนบางตัวถึงเป็นกลาง สาเหตุที่การแปรผันทางพันธุกรรมอาจไม่ก่อให้เกิดการเปลี่ยนแปลงใดๆ ในสมรรถภาพทางกาย–ที่เราหมายถึงโดยเป็นกลาง มีความแปรปรวนในระดับหนึ่ง แต่ก็ไม่ได้ทำให้เกิดอะไร ความแตกต่างเพื่อความสำเร็จในการสืบพันธุ์ กลไกที่ทำให้เกิดการเปลี่ยนแปลงแบบสุ่มและความสำคัญของความเป็นกลางสำหรับวิวัฒนาการระดับโมเลกุล และตอนนี้ฉันจะพูดถึงวิวัฒนาการที่ไม่เหมาะสม เพื่อที่คุณจะได้เห็นว่ากระบวนการวิวัฒนาการสามารถส่งผลให้เกิดสถานการณ์ที่สิ่งมีชีวิตไม่สามารถปรับตัวให้เข้ากับแหล่งที่อยู่อาศัยได้ดีเพียงใด และด้วยเหตุนี้ เราจะครอบคลุมผลลัพธ์ที่เป็นไปได้ที่สำคัญของวิวัฒนาการ: การปรับตัว ความเป็นกลาง และการปรับตัวที่ไม่เหมาะสม

บทที่ 2 การเปลี่ยนแปลงของยีนและกรดอะมิโนไม่สะท้อนในฟีโนไทป์ [00:04:56]

โอเค นี่คือแผนภาพนามธรรมที่ดีที่จะอธิบายว่าทำไมความเป็นกลางจึงเกิดขึ้น สิ่งที่ฉันต้องการให้คุณจินตนาการคือพื้นที่จีโนไทป์ ซึ่งจีโนไทป์ที่เป็นไปได้ทั้งหมดสำหรับสิ่งมีชีวิตนั้นอาจเกิดขึ้นได้ แค่คิดว่าเป็นวิธีที่แตกต่างกันทั้งหมดที่คุณอาจสร้างขึ้น หากเหตุการณ์การรวมตัวใหม่ที่เป็นไปได้ทั้งหมดในพ่อและแม่ของคุณทำให้เกิดเซลล์สืบพันธุ์ที่เป็นไปได้ทั้งหมดและไซโกตที่เป็นไปได้ทั้งหมด มีพื้นที่จีโนไทป์สำหรับคุณ

จีโนไทป์เหล่านั้นจำนวนมากจะผลิตฟีโนไทป์เดียวกัน และนั่นเป็นเพราะยีนจำนวนมากและนิวคลีโอไทด์จำนวนมากในจีโนม ลำดับดีเอ็นเอจำนวนมากในจีโนม ไม่ได้สร้างความแตกต่างใดๆ กับโปรตีนที่ผลิตขึ้น ยังมีเรื่องอื่นๆ เกิดขึ้นและเราจะดำเนินการผ่านมันไป ฟีโนไทป์จำนวนมากมีความเหมาะสมเหมือนกัน

พวกคุณมาจากครอบครัวลูกคนเดียวกี่คน? โอเค พ่อแม่ของคุณทุกคนมีความฟิตเหมือนกัน ครอบครัวลูกสองคนมีกี่คน? พ่อแม่ของคุณทุกคนมีความฟิตเหมือนกัน ตกลง? สิ่งนี้เกิดขึ้นมากมาย โดยพื้นฐานแล้วเมื่อเราพูดว่าฟีโนไทป์จำนวนมากมีความเหมาะสมเหมือนกัน เราแค่หมายความว่าในประชากรใด ๆ จะมีสิ่งมีชีวิตจำนวนมากที่ทุกคนมีลูกสองคนหรือทุกคนมีลูกสามคนหรืออะไรทำนองนั้น ลูกหลานสองคนทุกคนมีความฟิตเหมือนกัน

จากนั้นเมื่อเราดูครึ่งทางทั้งหมด [จะดูสมเหตุสมผลเมื่อดูรูป] ที่นี่ เราจะเห็นว่า G1, G2 และ G3 เป็นกลางด้วยความเคารพซึ่งกันและกัน เมื่อวัดในสภาพแวดล้อมที่แน่นอน แต่ต่างกัน G4. ดังนั้นที่นี่ เรามีความแปรปรวนทางพันธุกรรมมากมายที่เป็นกลาง และเป็นกลางด้วยเหตุผลหลายประการ เรากำลังจะดำเนินการผ่านเหตุผลเหล่านั้น

ประการแรก การกลายพันธุ์บางอย่างในลำดับดีเอ็นเอมีความหมายเหมือนกัน นั่นหมายความว่าพวกมันไม่สร้างการเปลี่ยนแปลงใดๆ ในกรดอะมิโนที่ถูกเข้ารหัสไว้ในโปรตีน ประการที่สอง มีซูโดจีนีสและ DNA ที่ไม่ได้ถอดรหัสชนิดอื่นๆ ในจีโนม ซูโดจีนีนเป็นยีนที่เกิดจากเหตุการณ์ซ้ำซ้อนของยีนในอดีตและไม่เคยชินกับสิ่งใดเลย และถ้าคุณดูจีโนมทั้งหมด ซึ่งตอนนี้คุณสามารถทำเพื่อสิ่งมีชีวิตจำนวนมาก โดยมองหาสิ่งเหล่านี้ คุณจะพบว่าพวกมันอยู่ทั่วทุกแห่ง

มีการทำซ้ำของยีนหลายครั้งในอดีต และบางส่วนทำให้เกิดยีนที่ได้มาโดยการคัดเลือกและใช้การพัฒนาเพื่อการทำงานบางอย่าง คนอื่นไม่ได้ ซูโดจีนีสคือสิ่งที่ไม่ได้ใช้ ชะตากรรมปกติของพวกเขาจะถูกกัดเซาะโดยการกลายพันธุ์ ดังนั้น ข้อมูลที่เป็นประโยชน์ที่ครั้งหนึ่งเคยอยู่ในนั้นค่อยๆ ถูกทำลายโดยการกลายพันธุ์ และหากพวกมันนั่งเฉยๆ นานพอ พวกมันจะไม่สามารถตรวจพบได้อีกต่อไป คุณจะไม่สามารถบอกได้อีกต่อไปว่าพวกมันเคยเป็นยีนที่ใช้งานได้จริง ก่อนที่พวกมันจะถูกทำซ้ำ

มีการแปรผันของกรดอะมิโนที่เป็นกลาง ด้วยเหตุผลหลายประการ กรดอะมิโนบางชนิดมีขนาดโมเลกุลและคุณสมบัติของประจุที่ใกล้เคียงกันมาก ดังนั้นหากคุณแทนที่พวกมันด้วยโปรตีน พวกมันจะไม่สร้างความแตกต่างอย่างมากกับรูปร่างหรือการกระจายประจุของโปรตีน และถ้าคุณดูโปรตีนทั้งหมด ซึ่งปกติแล้วจะค่อนข้างใหญ่–บอกว่าถ้าเป็นเอ็นไซม์–โดยปกติ มันจะมีแอกทีฟไซต์ที่อยู่ในส่วนเชิงพื้นที่เล็กๆ ของมัน เพื่อให้สถานีย่อยกรดอะมิโนนั้น เกิดขึ้นที่บริเวณแอกทีฟไซต์ ทำให้เกิดความแตกต่างอย่างมากกับหน้าที่ของมัน และจากนั้นก็อาจส่งผลต่อความสมบูรณ์ของร่างกาย และการแทนที่กรดอะมิโนที่เกิดขึ้นไกลจากไซต์แอคทีฟนั้นมีผลกระทบเพียงเล็กน้อยต่อการทำงานของโปรตีน แม้ว่าจะมีขนาดหรือโครงสร้างประจุต่างกันก็ตาม

จึงมีการแปรผันของกรดอะมิโนที่เป็นกลาง และในที่สุดก็มีบางอย่างที่เป็นนามธรรมมากกว่าเล็กน้อย และโดยพื้นฐานแล้วมันเป็นนามธรรมเพราะเราไม่เข้าใจเป็นอย่างดีว่าเป็นปรากฏการณ์จริง แต่เราไม่เข้าใจ รู้อยู่เสมอว่ากลไกคืออะไร–และนั่นคือช่องทางของการพัฒนา ผมจะอธิบายคร่าวๆ แล้วพยายามอธิบายเกี่ยวกับการจัดช่องคลองให้ฟังในสองสามสไลด์

นี่คือ รหัสพันธุกรรม และโดยพื้นฐานแล้ว คุณสามารถเห็นแฝดสามของนิวคลีโอไทด์ ที่ถูกแปลเป็นกรดอะมิโนต่างๆ และจุดนำกลับบ้าน จุดนำกลับบ้านจุดแรกจากนี้ คือสำหรับกรดอะมิโนเฉพาะใดๆ–ฟีนิลอะลาลานีน ตัวอย่างเช่น ที่นี่มีสองรหัสสำหรับฟีนิลอะลานีน และดูสิ มีหกรหัสสำหรับลิวซีน ดังนั้นการเปลี่ยนแปลงใดๆ ภายในชุดลำดับนิวคลีโอไทด์นี้จึงไม่ทำให้เกิดการเปลี่ยนแปลงในกรดอะมิโนที่เข้าสู่โปรตีนเลย พวกเขาเป็นกลางด้วยความเคารพซึ่งกันและกัน เพราะพวกเขามีความหมายเหมือนกัน

และคุณสามารถทราบความหมายของคำพ้องความหมายอีกระดับหนึ่งได้ด้วยการดูคลาสของกรดอะมิโนที่มีประจุลบ กรดอะมิโนอะโรมาติก และอื่นๆ การแทนที่ระหว่างกรดแอสปาร์ติกและกรดกลูตามิกซึ่งมีประจุลบทั้งคู่ มีแนวโน้มที่จะสร้างความแตกต่างด้านสมรรถภาพน้อยกว่าการแทนที่ไลซีนสำหรับกรดกลูตามิก จึงมีระดับในโปรตีนอีกด้วย

ยีนเทียมที่ฉันพูดถึงเล็กน้อย พวกมันไม่ได้ถอดเสียงและนิวคลีโอไทด์ทั้งหมดของพวกมันมีอิสระที่จะแยกจากกันโดยการสุ่ม นั่นหมายความว่าไม่มีกระบวนการแก้ไขที่แท้จริงเกิดขึ้น–การคัดเลือกโดยธรรมชาติไม่เลือกการกลายพันธุ์แบบใดแบบหนึ่งไปยังแบบอื่น ไม่น่าจะเกิดขึ้นในเด็กหรือลูกหลานมากกว่าคนอื่น ยีนนี้ถูกปิด และจะถูกกัดเซาะอย่างหลีกเลี่ยงไม่ได้ เนื่องจากลำดับ DNA ทั้งหมดอาจมีการกลายพันธุ์ และหากการกลายพันธุ์เกิดขึ้นใน pseudogene ไม่มีเหตุผลใดเป็นพิเศษสำหรับกลไกการซ่อมแซมที่จะให้ความสำคัญกับมันมากไปกว่าที่ทำ ไปที่สิ่งอื่น ตกลง?

ดังนั้นสิ่งเหล่านี้จึงไม่ได้รับการซ่อมแซมโดยเฉพาะอย่างยิ่งโดยกลไกการซ่อมแซม และไม่ได้ซ่อมแซมเลยโดยการคัดเลือกโดยธรรมชาติ ดังนั้นความคิดเห็นนี้จะนำไปใช้กับ DNA จำนวนมากที่ไม่ได้คัดลอกมา สิบห้าหรือยี่สิบปีที่แล้ว เมื่อค้นพบ DNA คลาสนี้ ผู้คนเรียกมันว่า 'DNA ขยะ' เพราะพวกเขาไม่คิดว่ามันจะทำอะไร และแน่นอนว่ามันเป็นความสุขของนักวิทยาศาสตร์รุ่นเยาว์ที่จะแสดงให้พวกรุ่นพี่เห็น ว่าสิ่งนี้มักจะมีฟังก์ชั่น & โดยปกติแล้วมันเป็นฟังก์ชั่นควบคุม บางส่วนสร้างโมเลกุลอาร์เอ็นเอขนาดเล็กที่ใช้ในการควบคุม แต่บางส่วนยังถูกใช้เป็นไซต์และเส้นทางการส่งสัญญาณและช่วยควบคุมการพัฒนา

อย่างไรก็ตาม บางส่วนก็เป็นขยะจริงๆ ตัวอย่างเช่น มีกระบวนการที่มั่นคงโดยที่ไวรัสชนิดต่างๆ มารวมตัวเข้ากับจีโนมของโฮสต์ และนี่เป็นส่วนหนึ่งของกลยุทธ์การปรับตัวของไวรัสที่พวกเขาสามารถป้องกันความเสี่ยงจากการเดิมพันด้วยการเกาะติดจีโนมและอยู่รอบๆ สักพักก็โผล่ออกมาในจุดที่อาจจะได้เปรียบแต่ไม่สะดวกสำหรับเจ้าบ้าน

อย่างไรก็ตาม มันเป็นกลยุทธ์ที่อันตรายเพราะบางครั้งพวกมันก็ติดอยู่กับส่วนต่างๆ ของจีโนมที่ไม่เคยถูกถอดเสียงออกมา และพวกมันก็ไม่เคยออกไป ดังนั้น ที่จริงแล้ว จีโนมของสิ่งมีชีวิตส่วนใหญ่บนโลกจึงเกลื่อนไปด้วยโครงกระดูกฟอสซิลของไวรัส ฉันอ่านการประมาณการครั้งหนึ่งว่าจีโนมมนุษย์มีไวรัสฟอสซิลอยู่เป็นจำนวนมาก ฉันลืมตัวเลขที่แน่นอนในเวลานั้น สิ่งนี้ได้รับความนิยมเมื่อลำดับดีเอ็นเอเริ่มออกมาเป็นจำนวนมาก แต่รู้แค่ว่า ตกลง?

จึงมีดีเอ็นเอขยะ และบางส่วนของมันมีอยู่เพราะทั้งไวรัสฟอสซิลหรือทรานสโปซอน ยีนที่กระโดด เข้ามาอยู่ในตำแหน่งที่พวกมันไม่สามารถถอดความได้อีกต่อไป และจากนั้นพวกมันก็กลายเป็นสุสาน ความคิดที่น่าอึดอัดไม่ใช่หรือว่าคุณแค่แบกสุสานไวรัส? แต่คุณเป็น

บทที่ 3 วิวัฒนาการที่เป็นกลางในประวัติศาสตร์ชีวิต [00:14:29]

โอเค ความแปรผันของกรดอะมิโนที่เป็นกลาง ฉันได้พูดคุยเกี่ยวกับเรื่องนี้เล็กน้อยเมื่อฉันแนะนำรหัสพันธุกรรม ดังนั้นนี่คือการแทนที่กรดอะมิโนที่ไม่ทำให้เกิดการเปลี่ยนแปลงใดๆ ในเรขาคณิตหรือการเปลี่ยนแปลงประจุใดๆ ในเรขาคณิตและเคมีไฟฟ้าของตำแหน่งการทำงานภายในโปรตีน และผมอยากพูดถึงกรณีแรกๆ ของวิวัฒนาการโมเลกุล ที่เป็นกรณีของอัลฟา-โกลบิน ดังนั้นเฮโมโกลบินของคุณจึงมีสายอัลฟาสองสายและสายที่ไม่ใช่อัลฟาสองสาย มีสายโซ่เบต้าหากคุณเป็นผู้ใหญ่และมีสายแกมมาหากคุณเป็นตัวอ่อนสาเหตุที่มันเปลี่ยนจากแกมม่าเป็นเบตาคือการเปลี่ยนคุณสมบัติการจับกับออกซิเจน เนื่องจากตัวอ่อนต้องดูดออกซิเจนออกจากเลือดของแม่ ตกลง?

ถ้าเราดูลำดับอัลฟาโกลบินเหล่านี้ ในกลุ่มสัตว์มีกระดูกสันหลังที่ค่อนข้างกว้าง และเราใช้ตัวอย่างในลักษณะที่สามารถมองย้อนเวลากลับไปได้ค่อนข้างไกล เราสามารถระบุจุดสาขาเหล่านี้โดยประมาณจากบันทึกฟอสซิล ตกลง? ดังนั้นสุนัขและมนุษย์จึงมีบรรพบุรุษร่วมกันซึ่งอาจอยู่ที่ไหนสักแห่งในช่วงปลายยุคครีเทเชียส กลางครีเทเชียสกลาง บรรพบุรุษร่วมกันคนสุดท้ายของเรากับจิงโจ้อยู่ที่ประมาณ 140 ล้านปีบางที สัตว์เลี้ยงลูกด้วยนมอยู่ที่นั่นในขณะที่ไดโนเสาร์อยู่ที่นั่น พวกเขาเป็นเพียงเด็กน้อย แต่มีสัตว์เลี้ยงลูกด้วยนมอยู่ที่นั่น บรรพบุรุษร่วมกับฉลามคนสุดท้ายของเรากลับมาแล้วเมื่อประมาณ 440 ล้านปี

ลองหาลำดับของอัลฟาเฮโมโกลบินทั้งหมดที่คุณดึงออกมาจากสิ่งเหล่านี้–มันเป็นโมเลกุลที่สะดวก คุณแค่ต้องการตัวอย่างเลือด–และพล็อตมันบนกราฟ ดังนั้นคุณจึงประมาณเวลาจากฟอสซิลและประมาณความแตกต่างโดยเฉลี่ย “k” นี้เป็นตัววัดความแตกต่างของกรดอะมิโนในโปรตีน และเส้นตรงคือสิ่งที่คุณจะได้รับหากอัตราการแทนที่กรดอะมิโนเป็นแบบสุ่ม สม่ำเสมอ สม่ำเสมอ ตกลง?

มันค่อนข้างใกล้กับเส้น มีการเบี่ยงเบนบางอย่าง แต่นี่เป็นหลักฐานที่เก่าแก่ที่สุดบางส่วน ซึ่งเคยเป็นมาก่อนการจัดลำดับดีเอ็นเอจะกลายเป็นเรื่องง่าย เมื่อการจัดลำดับโปรตีนทำได้ง่ายกว่าการจัดลำดับดีเอ็นเอ นี่เป็นหลักฐานบางส่วนที่เก่าแก่ที่สุดที่มีบางอย่างเช่นนาฬิกาโมเลกุล กล่าวอีกนัยหนึ่ง ถ้าเราได้สัตว์มีกระดูกสันหลังที่เราไม่เคยเห็นมาก่อน อาศัยอยู่ในป่าที่ถูกลืมไป และมันมีสัณฐานวิทยาแปลก ๆ และเราไม่รู้ว่าใครเป็นญาติของมัน และเราอยากรู้ว่ามันจะมีเมื่อไหร่ แบ่งปันบรรพบุรุษกับสิ่งที่เรามี และมันวางแผนไว้ตรงนี้–ความแตกต่างกับสิ่งที่เรากำลังเปรียบเทียบอยู่ตอนนี้ วาดไว้ที่นี่–แล้วเราจะมีเวลาประมาณที่ดีในการที่จะอยู่สุดท้ายของบรรพบุรุษร่วมกัน สำหรับสิ่งใหม่นั้น สปีชีส์ที่ยังไม่ได้ค้นพบ โดยอิงจากการสันนิษฐานว่ากำลังประสบกับวิวัฒนาการเหมือนคนอื่นๆ

โอเค เหตุผลที่สี่ที่ความแปรปรวนทางพันธุกรรมอาจเป็นกลางก็คือการสร้างคลอง โดยทั่วไปแล้วการทำให้เป็นคลองหมายความว่ามีกลไกการพัฒนาที่จำกัดช่วงของการแปรผันของฟีโนไทป์ ดังนั้นถึงแม้ว่าจะมีการกลายพันธุ์ในจีโนม หรือมีผลกระทบต่อสิ่งแวดล้อมในทางที่ควบคุมโดยพันธุกรรม ที่คุณยังคงดำเนินต่อไป เพื่อให้ได้ฟีโนไทป์เดียวกัน

บางสิ่งเกี่ยวกับฟีโนไทป์ของคุณนั้นเสถียรมาก พวกเขาไม่ตอบสนองต่อการกลายพันธุ์มากนัก ความจริงที่ว่าคุณมีสี่ขา ความจริงที่ว่าคุณมีห้านิ้วของสิ่งที่โบราณและมั่นคงและมีกลไกการบัฟเฟอร์พัฒนาการที่ทำให้พวกเขาเป็นเช่นนั้น ดังนั้นสิ่งเหล่านี้ กลไกการคลองเหล่านี้ ต่อต้านแนวโน้มของการแปรผันในปัจจัยทางพันธุกรรมหรือสิ่งแวดล้อมเพื่อรบกวนฟีโนไทป์ที่พวกมันรักษาให้อยู่ในสถานะคงที่

แล้วจะเกิดอะไรขึ้นกับยีนที่สร้างฟีโนไทป์นี้ แต่พวกมันกำลังถูกบัฟเฟอร์โดยกลไกการพัฒนาเหล่านี้? พวกมันมีอิสระมากขึ้นในการสะสมความแปรปรวนที่เป็นกลาง เพราะโดยพื้นฐานแล้ว ผลที่ตามมาของการกลายพันธุ์ในยีนเหล่านั้นได้ถูกกำจัดออกไปแล้ว พวกมันถูกบัฟเฟอร์ออกแล้ว ขณะนี้ มีการคาดเดากันมากมายว่าทำไมการสร้างคลองจึงอาจมีวิวัฒนาการ หรืออาจเป็นแค่ผลพลอยได้ และตรงไปตรงมาในกรณีส่วนใหญ่เราไม่มีความคิด นี่เป็นคำถามการวิจัยแบบเปิด

ดังนั้น เหตุผลหนึ่งที่ผู้คนคิดว่าคุณลักษณะของสิ่งมีชีวิตทั้งหมด เช่น ห้านิ้วหรือสี่ขา อาจถูกบัฟเฟอร์ไม่ใช่เพราะการเลือกเพื่อบัฟเฟอร์ลักษณะเหล่านั้น แต่เพราะมีแรงการคัดเลือกที่แข็งแกร่งมากที่ทำงานในระดับจุลภาคภายในเซลล์ บนเส้นทางการส่งสัญญาณยีน ดังนั้นคุณจึงบัฟเฟอร์สิ่งเหล่านั้น และเป็นผลพลอยได้จากการที่คุณได้รับบัฟเฟอร์ในระดับที่สูงขึ้น เราไม่รู้หรอกว่าเกิดอะไรขึ้น แต่เรารู้ว่าการสร้างคลองนั้นมีอยู่จริง และเรารู้ว่ามันมีผลที่ตามมา ทำให้เกิดการสะสมความผันแปรทางพันธุกรรมที่ซ่อนอยู่ นั่นคือเหตุผลหลักประการที่สี่ว่าทำไมจึงสามารถมียีนที่เป็นกลางได้

ทีนี้ อะไรเป็นสาเหตุของการเบี่ยงเบนแบบสุ่มหรือทางพันธุกรรม? สิ่งนั้นจะทำให้เกิดความเป็นกลาง แต่แล้วเกิดอะไรขึ้นกับยีนที่เป็นกลาง? กลไกเหล่านี้เป็นกลไกที่สามารถทำให้เกิดการสุ่มเสี่ยงในวิวัฒนาการได้

บทที่ 4 กลไกของวิวัฒนาการที่เป็นกลางหรือแบบสุ่ม [00:20:38]

ประการแรกคือการกลายพันธุ์ ประการที่สองคือลอตเตอรี Mendelian ซึ่งเป็นแนวคิดที่ว่าไมโอซิสเป็นเหมือนเหรียญที่ยุติธรรม จากนั้นเราก็มีผลกระทบระดับประชากร การกลายพันธุ์ที่คุณนึกได้ว่าเป็นเหตุการณ์ระดับโมเลกุล ลอตเตอรี Mendelian เป็นกิจกรรมมือถือ ผลกระทบของผู้ก่อตั้งและคอขวดทางพันธุกรรมเป็นผลต่อประชากร แล้วเราก็มีผลทางด้านประชากรศาสตร์ ซึ่งเป็นความผันแปรของความสำเร็จในการสืบพันธุ์ในประชากรทุกขนาด สิ่งเหล่านี้มีส่วนทำให้เกิดการเปลี่ยนแปลงแบบสุ่ม และตอนนี้ฉันอยากจะก้าวผ่านมันไป และให้ความรู้สึกที่เป็นรูปธรรมมากขึ้นเกี่ยวกับวิธีการทำงานของพวกเขา

มีความรู้สึกบางอย่างที่การกลายพันธุ์ไม่ใช่แบบสุ่ม ตกลง? การกลายพันธุ์เกิดขึ้นที่ไซต์บางแห่งบ่อยกว่าไซต์อื่น ในแบคทีเรียก่อโรคที่กำลังเผชิญกับสภาพแวดล้อมที่ท้าทาย มันจะเพิ่มอัตราการกลายพันธุ์ทั้งหมดโดยลดการควบคุมการซ่อมแซม DNA ของมัน เป็นเรื่องง่ายทีเดียวที่จะเพิ่มอัตราการกลายพันธุ์ของจีโนมทั้งหมด คุณเพียงแค่ละเลยที่จะซ่อมแซมและมันจะกลายพันธุ์เร็วขึ้น ตกลง? ดังนั้น หากแบคทีเรียถูกย้ายไปยังสภาพแวดล้อมใหม่ หรือ ตัวอย่างเช่น หากแบคทีเรียก่อโรคถูกใส่เข้าไปในสัตว์มีกระดูกสันหลังที่มีระบบภูมิคุ้มกันที่กระตือรือร้นและคุกคามมาก มันจะเพิ่มอัตราการกลายพันธุ์ของแบคทีเรีย

การเปลี่ยนแปลงระหว่างคลาสของนิวคลีโอไทด์–ดังนั้น พิวรีนถึงพิวรีน, ไพริมิดีนถึงไพริมิดีน– เกิดขึ้นบ่อยกว่าการเปลี่ยนผ่าน ดังนั้น purines จะกลายพันธุ์เป็น purines บ่อยกว่า purines จะกลายพันธุ์เป็น pyrmidines

และการกลายพันธุ์จะไม่ทำให้เกิดการเปลี่ยนแปลงแบบสุ่มในปริภูมิฟีโนไทป์ อันนี้อีกครั้งเป็นนามธรรมเล็กน้อย ตกลง? แต่การกลายพันธุ์สามารถทำให้เกิดการเปลี่ยนแปลงในชุดของความเป็นไปได้ที่สืบทอดมาเท่านั้น มีความแปรปรวนของการกลายพันธุ์น้อยมากในประชากรมนุษย์สำหรับอวัยวะชุดที่หก ซึ่งเติบโตตรงกลางหลังของเรา ซึ่งสามารถเปลี่ยนเป็นปีกของเทวดาได้น้อยมาก ตกลง? หอยมีความแปรปรวนของการกลายพันธุ์น้อยมากสำหรับอวัยวะที่อาจเกี่ยวข้องกับการหายใจ

ดังนั้นการกลายพันธุ์จึงไม่ครอบคลุมพื้นที่ฟีโนไทป์ที่เป็นไปได้ทั้งหมด การกลายพันธุ์เป็นเพียงการก่อกวนในชุดความเป็นไปได้ที่สืบทอดมาจากเชื้อสายวิวัฒนาการที่กำหนด ดังนั้นพวกมันจึงไม่ทำการเปลี่ยนแปลงแบบสุ่มในสเปซฟีโนไทป์ แต่พวกมันสุ่มในความหมายที่สำคัญอย่างยิ่ง ไม่มีความสัมพันธ์ที่เป็นระบบระหว่างผลฟีโนไทป์ของการกลายพันธุ์กับความต้องการของสิ่งมีชีวิตที่เกิดขึ้น พวกมันสุ่มตามความฟิต

ดังนั้นเมื่อแบคทีเรียเหล่านั้นเข้าสู่ระบบภูมิคุ้มกันของสัตว์มีกระดูกสันหลัง และจะสะดวกมากสำหรับพวกมันที่จะกลายพันธุ์ซึ่งเป็นสิ่งที่ถูกต้องตรงที่พวกมันต้องการเพื่อหลีกเลี่ยงรูปแบบการป้องกันโดยเฉพาะในส่วนของโฮสต์ของพวกมัน พวกมันไม่ ได้รับมัน ตกลง? ธรรมชาติทั้งหมดจะให้การกลายพันธุ์แบบสุ่มเกี่ยวกับฟังก์ชันนั้น ๆ และหากพวกเขามีลูกหลานจำนวนมาก หนึ่งในนั้นอาจมีสิ่งที่ถูกต้องโดยโชค

ในทำนองเดียวกัน ในกรณีของคุณ มันอาจจะสะดวกมากสำหรับคุณที่จะมีการปรับตัวซึ่งช่วยให้คุณดูหน้าจอคอมพิวเตอร์เป็นเวลา 48 ชั่วโมงโดยไม่ปวดหัวและไม่ต้องลุกไปเข้าห้องน้ำ ตกลง? การกลายพันธุ์นั้นจะไม่เกิดขึ้น เพราะคุณต้องการฟังก์ชันนั้น จีโนมของคุณจะถูกปกปิดโดยการกลายพันธุ์แบบสุ่ม และเป็นไปได้มากที่ลูกของคุณคนหนึ่งสามารถดูหน้าจอนั้นได้นานกว่าคุณเล็กน้อย แต่นั่นจะเป็นเพราะมันเกิดขึ้นโดยบังเอิญ ไม่ใช่เพราะว่าการพัฒนาหรือวิวัฒนาการอาจคาดการณ์ได้ว่าหน้าที่นั้นจะเป็นประโยชน์

ดังนั้นกระบวนการของการกลายพันธุ์ทำให้เกิดรูปแบบที่หลากหลาย จากนั้นการคัดเลือกโดยธรรมชาติจะแก้ไข จัดเรียง คัดกรอง และ ณ จุดที่เกิดการเปลี่ยนแปลงนั้น ฟังก์ชันที่เป็นไปได้ของการแปรผันนั้นไม่ใช่คำถาม มันไม่ใช่ปัญหา แต่เป็นเพียงการสร้างรูปแบบ

โอเค อย่างที่สอง ไมโอซิสก็เหมือนเหรียญที่ยุติธรรม ดังนั้นนี่คือสิ่งที่คุณอาจพบว่าน่าเบื่อ คุณเคยได้ยินเกี่ยวกับไมโอซิสทั้งหมด พวกคุณคงเคยได้ยินเกี่ยวกับกฎของเมนเดลมาบ้างแล้ว คุณรู้ว่าความน่าจะเป็นที่เซลล์สืบพันธุ์จะเข้าสู่เซลล์สืบพันธุ์โดยเฉพาะ– ที่ยีนจะเข้าสู่เซลล์สืบพันธุ์เฉพาะคือ 50% และคุณคุ้นเคยกับสิ่งนี้เพราะคุณรู้ว่าความน่าจะเป็นที่เด็กจะเป็นเด็กชายหรือเด็กหญิงคือ 50% และนั่นเพราะที่โครโมโซมเพศ และโครโมโซมอื่นๆ ที่เรามี ความน่าจะเป็น ว่าโครโมโซมจะไปไม่ทางใดก็ทางหนึ่งคือ 50%

ที่น่าตื่นตาตื่นใจอย่างแน่นอน เหตุใดโครโมโซม Y ของฉันจึงไม่ออกฤทธิ์ 80% ทำไมมันถึง 50%? มีบางอย่างที่ลึกมากที่นี่ หากคุณสร้างระบบที่ทุกองค์ประกอบที่อาจแข่งขันกันถูกบังคับให้มีโอกาสเท่ากัน องค์ประกอบเหล่านั้นจะต้องร่วมมือกัน เพราะวิธีเดียวที่จะสามารถเพิ่มโอกาสของตนเองได้คือการเพิ่มส่วนอื่นๆ & #8217 ด้วยเช่นกัน

และด้วยเหตุนี้จึงเรียกปรากฏการณ์พิเศษนี้ว่ารัฐสภาแห่งยีน เป็นการค้นพบว่าธรรมชาติเมื่อประมาณสองพันล้านปีก่อนได้ค้นพบหลักการที่รัฐศาสตร์ของมนุษย์ไม่ได้ค้นพบจนกระทั่งการตรัสรู้ ซึ่งก็คือประชาธิปไตยมีความมั่นคง ไมโอซิสเป็นประชาธิปไตย ในไมโอซิส ยีนแต่ละตัวมีโอกาสที่ยุติธรรม และนั่นหมายความว่าในแง่หนึ่ง คุณมีสถานการณ์แบบหนึ่งยีน แบบโหวตเดียว

ดังนั้นฉันจะกลับมา–ฉัน’จะกลับมาที่ความยุติธรรมของการแบ่งแยกแบบไมโอติก แต่มีแนวคิดทั่วไปอยู่เบื้องหลัง ฉันเพิ่งให้สถานการณ์เล็ก ๆ กับคุณที่จะแนะนำว่าทำไมจึงถูกเลือก มันถูกเลือกเพื่อระงับความขัดแย้ง ทุกแง่มุมของพันธุกรรมได้พัฒนาขึ้น ดังนั้นเมื่อคุณใช้พันธุศาสตร์ หรือคุณใช้ชีววิทยาเซลล์ หรือคุณใช้ชีววิทยาพัฒนาการ มี–มีกระบวนการคัดเลือกที่สร้างสิ่งที่คุณศึกษา และมีทางเลือกอื่นที่ถูกปฏิเสธ และคุณกำลังดูเฉพาะตัวอย่างของสิ่งที่ ธรรมชาติสามารถผลิตได้ และนั่นก็กลายเป็นโครงการวิจัยที่น่าสนใจ

โอเค กลับไปที่รัฐสภาของยีน ฉันอ้างถึงความขัดแย้ง นี่คือความขัดแย้ง มีสิ่งที่เรียกว่าไดรเวอร์ meiotic ดังนั้นจึงมียีนที่เปลี่ยนกฎของเมนเดลได้จริง ๆ พวกมันเปลี่ยนความน่าจะเป็นที่พวกมันจะได้รับในรุ่นต่อ ๆ ไป มีใครเคยได้ยินว่าไดรเวอร์ meiotic ทำงานอย่างไร? มันเป็นระบบที่เจ๋ง พวกเขาใช้ยาพิษระยะยาวและยาแก้พิษระยะสั้น ดังนั้น ตัวขับแบบไมโอติกมักจะทำงานโดยการฆ่าเซลล์ใดๆ ที่ไม่มีสำเนาของตัวเอง ของยีนของมัน และให้ยาแก้พิษแก่เซลล์ของมันเอง

ดังนั้นในขณะที่เซลล์นั่งอยู่ที่นั่น ในรังไข่ หรือในอัณฑะ หรือในอวัยวะใด ๆ ที่สิ่งมีชีวิตนั้นมีอยู่ ตัวขับทางชีวภาพโดยพื้นฐานแล้วจะขจัดการแข่งขันและส่งเสริมผลประโยชน์ของตนเอง สิ่งเหล่านี้มีอยู่ทุกหนทุกแห่ง พวกมันพบได้บ่อยในแมลงหวี่และมีหลักฐานว่ามีการขับเคลื่อนแบบไมโอติกในจีโนมมนุษย์ ตกลง?

เมื่อสถานะดิพลอยด์พัฒนาขึ้น มีประวัติการบุกรุกมายาวนานโดยตัวขับเคลื่อนแบบไมโอติก และการตอบสนองต่อสิ่งนั้นก็คือยีนอื่นๆ ทั้งหมดต้องการทำให้ตัวขับแบบไมโอติกเหล่านี้หายไป พวกเขาบิดเบือนผลประโยชน์ของตนเอง คุณกำลังนั่งอยู่บนโครโมโซม คุณคือผู้บริสุทธิ์ โจรป่าบางคนเข้ามาแย่งชิงความสนใจของคุณ และตอนนี้โอกาสที่คุณจะเข้าสู่ยุคต่อไปมีเพียง 20% มากกว่า 50% ใครอยากได้ รู้ยัง? นั่นไม่ใช่ข้อตกลงที่ดี ดังนั้นกลไกต่างๆ ของจีโนมจึงเกิดขึ้นเพื่อยับยั้งการขับแบบมีโอติก และผลที่ได้คือกลไกที่ซับซ้อนมาก และเราเรียกมันว่าไมโอซิส

นั่นจึงไม่ใช่เหตุผลเดียวที่เป็นไปได้สำหรับความซับซ้อนในความเป็นธรรมของไมโอซิส มันเป็นสิ่งที่เป็นไปได้ ข้าพเจ้าขอเชิญคุณพิจารณาวิวัฒนาการทางวัฒนธรรมของระบอบประชาธิปไตยและตัดสินใจว่าเรื่องนี้อาจถูกขับเคลื่อนโดยประวัติศาสตร์ของการโกงด้วยหรือไม่ โดยเฉพาะอย่างยิ่งการละทิ้งผู้นำที่ไม่ได้เป็นตัวแทนของผลประโยชน์ของประชาชนอีกต่อไป ฉันคิดว่ามีความคล้ายคลึงกัน และฉันคิดว่าคุณจะพบว่ามันชัดเจนในปฏิญญาอิสรภาพ

โอเค กลไกที่ทำให้เกิดการเปลี่ยนแปลงแบบสุ่มก็เกิดขึ้นที่ระดับประชากรเช่นกัน หนึ่งในนั้นคือผลกระทบของผู้ก่อตั้ง สมมุติว่าผมพบประชากรใหม่ที่มีเพียงคุณเท่านั้น มีความเป็นไปได้สูงที่จะเกิดตาสีฟ้า และกับคุณก็มีโอกาสสูงที่จะเป็นตาสีน้ำตาล และเพื่อเลือกคุณ ฉันจึงพลิกเหรียญ ตกลง? ที่การก่อตั้งประชากรนั้น มีเหตุการณ์สุ่ม ซึ่งก็แค่สุ่มสุ่มตัวอย่างบุคคลสองสามคนจากประชากรจำนวนมาก

และผลจากสิ่งนี้ก็คือมีโรคบางชนิด โรคทางพันธุกรรมของมนุษย์ ที่หายากในประชากรมนุษย์โดยทั่วไป แต่พบได้บ่อยในประชากรที่ก่อตั้งโดยคนเพียงไม่กี่คน ได้แก่ โรค Tay-Sachs ในควิเบก โรคพอร์ฟีเรียใน ชาวแอฟริกันแห่งแหลมและโรคเบาหวานในเกาะพิตแคร์น ดังนั้นคุณก็แค่เอาตัวอย่างเล็กๆ น้อยๆ จากประชากรจำนวนมาก แล้วคุณจะได้บางสิ่งที่ไม่ได้เป็นตัวแทน และบางครั้งก็มีโรคทางพันธุกรรม

ปรากฏการณ์ระดับประชากรอีกประการหนึ่งที่ทำให้เกิดการสุ่มคือคอขวด สิ่งนี้จะเกิดขึ้นเมื่อประชากรชนกันจนมีขนาดเล็กมาก และมีอัลลีลเพียงไม่กี่อัลลีลเท่านั้นที่จะผ่านเข้าไปได้ ดังนั้น คุณอาจมียีนหลายเวอร์ชันในกลุ่มประชากรจำนวนมาก แต่ถ้าคุณสร้างประชากรใหม่เพียงสองหรือสามคน ยีนเหล่านี้ & 8217 เป็นซ้ำ บุคคลสองคนมีสำเนาของยีนเพียงสี่ชุดเท่านั้น ยีน ดังนั้นหากมีอัลลีลในประชากรเดิมจำนวนยี่สิบอัลลีล จำนวนสูงสุดที่เป็นไปได้ที่จะผ่านคอขวดนั้นก็คือสี่อัลลีลที่คุณทิ้งไว้เบื้องหลังสิบหก

ดูเหมือนว่านี่คือสิ่งที่เกิดขึ้นกับเสือชีตาห์ และเห็นได้ชัดว่าพวกมันเกือบจะเป็นโฮโมไซกัสโดยสมบูรณ์ โดยเฉพาะอย่างยิ่งในแง่ของยีนภูมิคุ้มกันของพวกมัน ข้อเท็จจริงทางชีววิทยาแปลก ๆ ที่คุณสามารถเอาผิวหนังของเสือชีตาห์หนึ่งตัวแล้วต่อกิ่งกับเสือชีตาห์ เสือชีตาห์ตัวอื่น ๆ ในโลก และการรับสินบนจะดำเนินต่อไป กล่าวอีกนัยหนึ่ง ระบบภูมิคุ้มกันของพวกมันค้นหาตัวอย่างผิวหนังจากเสือชีตาห์ตัวอื่นๆ ในโลกเพื่อเป็นผิวหนังของพวกมันเอง พวกเขาไม่พบความแตกต่าง และนั่นอาจเป็นสัญญาณว่าเสือชีตาห์ผ่านคอขวดของประชากรเพียงเล็กน้อยในช่วงสองสามพันปีที่ผ่านมา

การเลื่อนลอยทางพันธุกรรมเป็นผลมาจากความเป็นกลาง มันเป็นการสุ่มความถี่ของยีนที่เป็นกลาง หากคุณมองผ่านกล้องจุลทรรศน์ การเคลื่อนที่แบบบราวเนียนเป็นการกระตุกของอนุภาคฝุ่นเล็กๆ ที่คุณเห็นในกล้องจุลทรรศน์ และแท้จริงแล้วเป็นผลมาจากการกระแทกแบบสุ่มของโมเลกุลของน้ำที่กระทบกับอนุภาคฝุ่นนั้น แอนะล็อกระดับประชากรของความร้อนในน้ำคือความผันแปรของขนาดประชากร–uh ขอโทษนะ ความผันแปรของขนาดครอบครัว ยีนที่ผ่านลอตเตอรี Mendelian ของไมโอซิสเข้าสู่ไซโกต ตกลง? มันเข้าไปในไซโกต ไซโกตโตขึ้น

ยีนเฉพาะนี้เป็นกลาง มันไม่ได้สร้างความแตกต่างใดๆ ต่อความสำเร็จในการสืบพันธุ์ แต่บุคคลนั้น ๆ ที่อาศัยอยู่อาจมีครอบครัวเล็กหรือครอบครัวใหญ่ ด้วยเหตุผลที่ไม่เกี่ยวข้องกับหน้าที่ของยีน เป็นเพียงการพลิกเหรียญที่กำหนดว่าจะอยู่ในครอบครัวที่มีลูกสองคน ลูกเป็นศูนย์ หรือมีลูกจำนวนมาก ตกลง?

นั่นคือสิ่งที่ฉันหมายถึงการรวมการจับสลากของไมโอซิสกับความผันแปรของความสำเร็จในการสืบพันธุ์ และนี่คือกระบวนการที่เกิดขึ้นในประชากรทั้งหมด เมื่อผู้คนเริ่มเรียนรู้เกี่ยวกับความเหลื่อมล้ำทางพันธุกรรม พวกเขาคิดว่า โอ้ นั่นเป็นสิ่งที่เกิดขึ้นในประชากรกลุ่มเล็ก ๆ เพราะประชากรกลุ่มเล็ก ๆ ไม่ได้มีผลที่ราบเรียบของกฎของตัวเลขจำนวนมาก แต่สิ่งนี้จะเกิดขึ้นในกลุ่มประชากรทุกขนาด ตกลง? และโดยพื้นฐานแล้ว สิ่งที่ฉันหมายถึงคือผลที่ตามมาของความผันแปรในความสำเร็จในการสืบพันธุ์ ถ้ามันสัมพันธ์กับลักษณะหรือยีน อย่างยิ่ง มันก็จะทำให้เกิดการคัดเลือกโดยธรรมชาติ ถ้ามันไม่สัมพันธ์กันก็จะทำให้เกิดการล่องลอย

บทที่ 5 นาฬิกาโมเลกุลของวิวัฒนาการที่เป็นกลาง [00:35:29]

ดังนั้นหนึ่งในปริศนาที่แท้จริงของวิวัฒนาการเกี่ยวข้องกับสิ่งที่ทำให้ยีนจบลงด้วยการสุ่มโดยแต่ละบุคคลสร้างการคัดเลือกหนึ่ง สอง หรือสาม หรือศูนย์ต่อชีวิต สิ่งที่ทำให้ความแตกต่างระหว่างยีนที่ปรับตัวได้และยีนที่เป็นกลาง ฉันได้ร่างคำตอบที่เป็นไปได้สี่ข้อสำหรับคำถามนั้น ในกรณีใดกรณีหนึ่ง ปกติแล้วเราจะไม่ทราบแน่ชัดว่าสิ่งใดมีส่วนสนับสนุนมากที่สุด

แล้วเกิดอะไรขึ้นกับอัลลีลที่เป็นกลาง? [นั่นจะไม่ได้ผล ฉันแค่ต้องวาดสิ่งนี้] ถ้าเราวาดเวลาบนแกน X และเราวาดความถี่บนแกน Y และเกิดการกลายพันธุ์ขึ้น สิ่งปกติที่จะเกิดขึ้นกับการกลายพันธุ์ก็คือ มันจะเพิ่ม a เล็กน้อยและหายไป จากนั้นเรารอสักครู่เกิดการกลายพันธุ์อื่นเกิดขึ้น เรากำลังดูยีนต่างๆ มากมายในประชากร เรารอสักครู่เกิดการกลายพันธุ์อื่นเกิดขึ้น มันเข้ามาในประชากร

ความน่าจะเป็นที่จะได้รับการแก้ไขนั้นค่อนข้างต่ำเพราะความน่าจะเป็นเป็นสัดส่วนกับความถี่ ขอโทษด้วย เป็นสัดส่วนกับ 1/N ความถี่เท่ากับ 1/N เมื่อหายาก ความถี่จะต่ำมาก ดังนั้นความน่าจะเป็นที่จะได้รับการแก้ไขจึงต่ำ แต่บางครั้งการกลายพันธุ์ก็ตามมาที่จัดการผ่านความเหลื่อมล้ำทั้งหมดนี้ และทำให้มันผ่านสิ่งมีชีวิตที่โดยเฉลี่ยแล้ว มีลูกหลานมากกว่าสองคนต่อชีวิต และมันได้รับการแก้ไข

และถ้าคุณดูการกลายพันธุ์ในคลาสนี้ เวลาที่ใช้ในการแก้ไขจะแปรผันตามขนาดประชากร ดังนั้นสิ่งต่าง ๆ จะได้รับการแก้ไขได้เร็วกว่าในกลุ่มประชากรขนาดเล็กกว่าในประชากรกลุ่มใหญ่ จะมีพวกมันมากขึ้น การกลายพันธุ์จะเกิดขึ้นในกลุ่มประชากรจำนวนมาก แต่จะใช้เวลานานกว่าในการแก้ไข

เนื่องจากประชากรจำนวนมากขึ้นมีการกลายพันธุ์มากกว่า ปรากฎว่าขนาดของพวกมันชดเชยเวลาในการตรึงที่นานขึ้นได้อย่างแม่นยำ ดังนั้นหากคุณกำลังนับจำนวนที่ได้รับการแก้ไข–ไม่สำคัญว่าคุณจะอยู่ในประชากรกลุ่มเล็กหรือกลุ่มใหญ่–จำนวนการกลายพันธุ์ที่เท่ากันจะได้รับการแก้ไขในทั้งสองกรณี นั่นหมายความว่าตลอดช่วงประวัติศาสตร์วิวัฒนาการ ประชากรอาจเคยผ่านการชนและการระเบิด และในตอนท้าย ถ้าคุณเป็นนักพันธุศาสตร์ที่กำลังศึกษา DNA มองย้อนกลับไป ก็ไม่ได้สร้างความแตกต่างใดๆ ที่ประชากรมี การชนและการระเบิด ในแง่ของจำนวนอัลลีลที่เป็นกลางได้รับการแก้ไข พวกเขาเพิ่งได้รับการแก้ไขอย่างต่อเนื่องโดยไม่มีผลกระทบกับขนาดประชากร

ดังนั้นเราจึงไม่รู้ว่าอันไหนจะได้รับการแก้ไข เรารู้ว่าจะแก้ไขได้มากแค่ไหน นี่คือสาเหตุที่นาฬิกาโมเลกุลเป็นเหมือนนาฬิกาอะตอมที่ขับเคลื่อนด้วยการสลายตัวของกัมมันตภาพรังสี เราไม่รู้ว่ามีอะตอมกี่อะตอม–เราไม่รู้ว่าอะตอมใดจะสลายตัว แต่ในวินาทีนั้น เราก็รู้ว่าจะมีจำนวนเท่าใดสำหรับสารกัมมันตภาพรังสีที่กำหนด

เหตุผลก็คือมีความสม่ำเสมอเป็นจำนวนมาก เกิดขึ้นเพราะมีเหตุการณ์อิสระจำนวนมาก จีโนมเดี่ยวของเรามีคู่เบสประมาณสามพันล้านคู่ ยูเรเนียมหนึ่งโมลมีอะตอมประมาณ 6 คูณ 10 23 อะตอม–จริง ๆ แล้วถ้ามันเป็นโมล มันก็มีอะตอมจำนวนมากพอดีเลย– และจำนวนมหาศาลเหล่านี้ทำให้เกิดความสม่ำเสมอของกระบวนการ

โอเค นี่คือสิ่งที่เชื่อมโยงวิวัฒนาการระดับจุลภาคกับวิวัฒนาการมหภาค มันสร้างอัตราการทดแทนที่สม่ำเสมอในส่วนที่เป็นกลางของจีโนม และนี่คือสมมติฐานที่ว่าวิวัฒนาการระดับโมเลกุลเกิดขึ้นเมื่อมันสร้างต้นไม้แห่งชีวิตขึ้นใหม่ ช่วยให้เราสามารถประมาณความยาวของกิ่งและจุดของกิ่งก้านกับบรรพบุรุษร่วมคนสุดท้ายได้ ช่วยให้เราสามารถอนุมานเปรียบเทียบต้นไม้สายวิวัฒนาการได้ ดังนั้น การวิวัฒนาการที่เป็นกลางจึงเป็นเครื่องมือหลักในการสร้างกรอบวิวัฒนาการ ไม่ใช่สิ่งที่ต้องละเลย แต่เป็นบางสิ่งที่ต้องเข้าใจ เพราะมันทำให้เรามีที่มาของความสม่ำเสมอ ที่สามารถพาเราย้อนเวลากลับไปสู่ห้วงเวลาอันลึกล้ำ

ตัวอย่างเช่น นี่คือการแทนที่นิวคลีโอไทด์ที่เกิดขึ้นในไข้หวัดใหญ่ เหล่านี้เป็นไอโซเลตที่ยังอยู่ในช่องแช่แข็ง ตกลง? และพวกเขาทำงานที่นี่ตั้งแต่ประมาณปี 1925 ถึง 1990 เราไม่มีเลย ไม่มีข้อผิดพลาดในการประมาณอายุที่เราทราบเมื่อถูกแยกออก ตกลง? ขนาดประชากรมีความผันผวนอย่างมาก เมื่อถึงจุดหนึ่ง ไข้หวัดเหล่านี้บางสายพันธุ์กำลังนั่งอยู่ในเป็ดหรือหมูสองสามตัวในภาคตะวันออกเฉียงใต้ของจีน ในอีกจุดหนึ่ง พวกเขามีผู้คนอาศัยอยู่นับพันล้านคนทั่วโลก พวกเขาผ่านความผันผวนครั้งใหญ่ และอัตราการเปลี่ยนตัวที่สม่ำเสมอ ตกลง?

กลไกทั้งหมดของความเหลื่อมล้ำทางพันธุกรรมกำลังเล่นอยู่ที่นี่ ยกเว้นไมโอซิส เนื่องจากไข้หวัดใหญ่เป็นไวรัส ไม่ผ่านไมโอซิส ผลกระทบของความแปรผันของขนาดประชากรได้รับการชดเชยอย่างแน่นอนโดยอัตราการตรึงการกลายพันธุ์ที่เป็นกลางในประชากรขนาดใหญ่ที่ช้ากว่ามาก ดังนั้นแม้ในโรคระบาด เช่น ไข้หวัดใหญ่ นาฬิกาโมเลกุลก็ยังดีและคงที่

ข้อควรระวังบางประการเกี่ยวกับเรื่องนี้ โปรตีนและส่วนต่าง ๆ ของโปรตีนมีวิวัฒนาการในอัตราที่ต่างกัน พวกเขาใช้เฉพาะลำดับดีเอ็นเอที่ไม่ได้ถอดเสียงเท่านั้น มีความแตกต่างบางประการระหว่างเชื้อสายเนื่องจากเวลารุ่นต่างกัน

และฉันจะไม่พูดถึงเรื่องการปรับตัวเพราะฉันใช้เวลานานเกินไปที่จะพูดถึงความเป็นกลาง ดังนั้นคุณสามารถอ่านเกี่ยวกับการปรับที่ไม่เหมาะสม และฉันจะให้แนวคิดพื้นฐานแก่คุณ นี่คือแนวคิดพื้นฐานของการปรับตัวที่ไม่เหมาะสม หากการคัดเลือกโดยธรรมชาติมีความแข็งแกร่งในที่หนึ่งและสิ่งมีชีวิตก็ปรับตัวเข้ากับมันได้อย่างดี แต่พวกมันย้ายไปยังที่อื่นซึ่งพวกมันทำได้ไม่ดี ไม่ว่าด้วยเหตุผลใดก็ตาม เราเรียกสถานที่ที่ผลิตสิ่งมีชีวิตส่วนเกินว่าแหล่งกำเนิด และที่ซึ่งไม่เป็นผลดีต่อสิ่งมีชีวิตมีอ่าง ยีนในอ่างเป็นตัวแทนของสิ่งมีชีวิตซึ่งปกติแล้วจะถูกปรับให้เข้ากับแหล่งกำเนิด ดังนั้นหากสิ่งมีชีวิตได้รับการดัดแปลงอย่างดีในที่หนึ่งและย้ายไปยังอีกที่หนึ่งซึ่งแตกต่างกันมาก และพวกเขาไม่เคยได้รับโอกาส ที่จะเข้าสู่สมดุลทางวิวัฒนาการกับที่ใหม่นั้น ซึ่งเราเรียกว่าอ่างล้างมือ พวกมันก็จะถูกปรับให้เข้ากับอ่างล้างจาน นั่นเป็นแนวคิดพื้นฐานที่อยู่เบื้องหลังว่าการปรับตัวที่ไม่เหมาะสมสามารถเกิดขึ้นได้อย่างไร ตกลง?

งั้นผมขอโดดก่อนนะครับ ฉันจะดำเนินการอย่างรวดเร็วผ่านตัวอย่างเหล่านี้และไปให้ถึงจุดสิ้นสุด เพื่อแจ้งให้คุณทราบว่าจะเกิดอะไรขึ้นในครั้งต่อไป นี่คือกุญแจที่ฉันอยากให้คุณจำไว้ ฉันต้องการให้คุณจำได้ว่าไมโอซิสเป็นเหมือนเหรียญที่ยุติธรรม ฉันต้องการให้คุณจำไว้ว่าการตรึงอัลลีลที่เป็นกลางนั้นเหมือนกับการสลายตัวของกัมมันตภาพรังสีอย่างไร และฉันต้องการให้คุณจำไว้ว่าการตรึงอัลลีลที่เป็นกลางเป็นประจำจะสร้างนาฬิกาโมเลกุลที่ช่วยให้เราสามารถเชื่อมต่อไมโครกับวิวัฒนาการมหภาค โอเค นั่นแหละ’


ความแตกต่างทางพันธุกรรมถูกกำหนดโดยระยะทางทางภูมิศาสตร์ใน Clarkia pulchella

ทั้งความแตกต่างของสิ่งแวดล้อมและระยะทางทางภูมิศาสตร์อาจส่งผลต่อความแตกต่างทางพันธุกรรมของประชากรในภูมิประเทศ การทำความเข้าใจถึงความสำคัญเชิงสัมพันธ์ของตัวขับเคลื่อนเหล่านี้เป็นสิ่งที่น่าสนใจเป็นพิเศษในบริบทของขีดจำกัดของช่วงทางภูมิศาสตร์ เนื่องจากทั้งการไหลของยีนล้นและการขาดความหลากหลายทางพันธุกรรมเป็นสาเหตุของขีดจำกัดของช่วง เราตรวจสอบโครงสร้างทางพันธุกรรมภูมิทัศน์ของประชากรดอกไม้ป่าประจำปี 32 ตัว Clarkia pulchella จากทั่วพื้นที่ทางภูมิศาสตร์ของสปีชีส์ในแปซิฟิกตะวันตกเฉียงเหนือภายใน เราทดสอบว่าความแตกต่างของภูมิอากาศระหว่างประชากรมีอิทธิพลต่อความสำคัญของความแตกต่างทางพันธุกรรมหรือไม่ นอกจากนี้เรายังตรวจสอบรูปแบบของโครงสร้างประชากรและการไล่ระดับทางภูมิศาสตร์ในความหลากหลายทางพันธุกรรม ตรงกันข้ามกับความคาดหวังของเรา เราพบว่าความหลากหลายทางพันธุกรรมเพิ่มขึ้นใกล้กับขอบเทือกเขาทางเหนือของสปีชีส์ เราพบว่าไม่มีความแตกต่างทางภูมิอากาศอย่างเด่นชัดต่อความแตกต่างทางพันธุกรรม ซึ่งบ่งชี้ว่ากระบวนการใดๆ ที่อาจดำเนินการเพื่อแยกความแตกต่างของประชากรตามอุณหภูมิหรือการตกตะกอนไม่ส่งผลกระทบต่อตำแหน่งที่เป็นกลางในการวิเคราะห์เหล่านี้ ในทางกลับกัน ผลลัพธ์เหล่านี้สนับสนุนการเคลื่อนที่ของเมล็ดพันธุ์และละอองเกสรในระยะทางที่จำกัดเมื่อเทียบกับช่วงของสปีชีส์ และการเคลื่อนที่นี้และการรวมตัวของผู้อพยพที่ตามมาในสระยีนในท้องถิ่นไม่ได้รับอิทธิพลจากอุณหภูมิหรือการตกตะกอนที่คล้ายคลึงกันระหว่างประชากร เราพบว่าประชากรในภาคเหนือและภาคใต้ของเทือกเขามีแนวโน้มที่จะอยู่ในกลุ่มพันธุกรรมที่แตกต่างกัน และประชากรกลางและตะวันออกผสมกันระหว่างสองกลุ่มนี้ รูปแบบนี้อาจเป็นผลมาจากอุปสรรคทางภูมิศาสตร์ในอดีตหรือปัจจุบันที่เกี่ยวข้องกับที่ราบสูงโคลัมเบีย หรืออาจเป็นผลมาจากการแพร่กระจายจากชุดผู้ลี้ภัยที่แยกจากกันหลังจากระดับสูงสุดของธารน้ำแข็งสุดท้าย


สู่ความเข้าใจที่ดีขึ้นเกี่ยวกับการสร้างความแตกต่างของเซลล์เม็ดเลือด

Timm Schroeder ศาสตราจารย์แห่ง ETH Zurich Department of Biosystems Science and Engineering อธิบายว่าการควบคุมการสร้างความแตกต่างของสเต็มเซลล์มีบทบาทสำคัญในการรักษากระบวนการสร้างเลือดตามปกติ "หากระบบนี้เริ่มทำงานผิดพลาด ก็สามารถนำไปสู่โรคที่คุกคามชีวิตได้ เช่น โรคโลหิตจางและมะเร็งเม็ดเลือดขาว ดังนั้นเราจึงจำเป็นต้องมีความเข้าใจที่ดีขึ้นเกี่ยวกับกลไกระดับโมเลกุลที่เกี่ยวข้องกับกฎระเบียบนี้"

มีโปรตีนสองชนิดคือ GATA1 และ PU.1 ซึ่งเป็นจุดเน้นของการวิจัย คิดว่าโปรตีนเหล่านี้มีบทบาทสำคัญในกลไกการสร้างความแตกต่างของเซลล์เม็ดเลือด "สิ่งเหล่านี้เป็นปัจจัยการถอดความที่สามารถเปิดใช้งานหรือปิดใช้งานโปรแกรมทางพันธุกรรมที่ครอบคลุมด้วยยีนเป้าหมายจำนวนมาก สิ่งนี้ทำให้พวกเขามีอำนาจควบคุมชะตากรรมของเซลล์&rdquo กล่าว

การวัดโปรตีน GATA1 และ PU.1 ในเซลล์เดี่ยวทำให้นักวิจัยเห็นว่าโปรตีนเหล่านั้นไม่ใช่ตัวกลางในการสร้างความแตกต่างของเซลล์เม็ดเลือด "เป็นเวลาหลายทศวรรษแล้วที่คิดว่าปัจจัยการถอดรหัสทั้งสองนี้มีหน้าที่ในการตัดสินใจเกี่ยวกับสายเลือดสำหรับสเต็มเซลล์ ตอนนี้เราสามารถแสดงให้เห็นแล้วว่าไม่เป็นเช่นนั้น แต่กลไกอื่นๆ จะต้องรับผิดชอบต่อการตัดสินใจเหล่านี้" ศาสตราจารย์ชโรเดอร์อธิบาย

การวิจัยในอนาคตจะต้องสอบปากคำกลไกระดับโมเลกุลทางเลือกเพื่อทำความเข้าใจเพิ่มเติมเกี่ยวกับรูปแบบการสร้างความแตกต่างของเซลล์ต้นกำเนิดเม็ดเลือดที่ซับซ้อนอย่างไม่น่าเชื่อ และเพื่อช่วยผู้ที่ทุกข์ทรมานจากโรคเกี่ยวกับเซลล์เม็ดเลือด


ดูวิดีโอ: What is HUMAN GENETIC VARIATION? What does HUMAN GENETIC VARIATION mean? (มิถุนายน 2022).