ข้อมูล

ในการวิจัยจีโนม ปัญหาในการทำแผนที่ที่อาจเกิดจากการอ่านสั้นเกินไปคืออะไร

ในการวิจัยจีโนม ปัญหาในการทำแผนที่ที่อาจเกิดจากการอ่านสั้นเกินไปคืออะไร


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

ในสถานการณ์ต่อไปนี้: คุณได้รับการอ่านลำดับสั้น ๆ ของ RNA ของพืชที่ได้รับจากเครื่องหาลำดับถัดไป (ชิ้นส่วนที่มีความยาว 20-30 นิวคลีโอไทด์) คุณพยายามแมปพวกมันกลับไปที่จีโนม แต่สัดส่วนที่สำคัญของพวกมันไม่สอดคล้องกัน

คำถามคือ: ให้คำอธิบายที่ชัดเจนว่าเหตุใดการจัดตำแหน่งของลำดับสั้น ๆ จึงอาจล้มเหลว นอกเหนือจากการปนเปื้อนที่อาจเกิดขึ้นหรือปัญหาทางเทคนิคในระหว่างการเตรียมอาร์เอ็นเอ

ฉันจะตอบเพราะอ่านสั้นและเพราะ introns (เนื่องจากเป็น RNA)

สถานการณ์อื่น: มีข้อบ่งชี้บางประการว่าลำดับที่เป็นปัญหามาจากไวรัส RNA ของพืชที่ไม่มีลักษณะเฉพาะ คุณจะทำอย่างไรต่อไป? คำเตือนเฉพาะที่มีการอ่านลำดับแบบสั้นมีอะไรบ้าง

ฉันได้รับคำถามข้างต้น ฉันเป็นนักเรียนวิทยาศาสตร์คอมพิวเตอร์ที่ทำชีวสารสนเทศ นักชีววิทยาคนใดสามารถตอบได้จะได้รับการชื่นชมอย่างดี


ในฐานะนักชีวสารสนเทศเช่นกัน ฉันไม่ใช่สิ่งที่คุณขอ แต่ฉันทำงานกับพันธุศาสตร์พืช ดังนั้นฉันจะพยายามตอบต่อไป

สิ่งที่คุณกำลังทำแผนที่คือ RNA ดังที่คุณทราบแล้ว เหตุการณ์ประกบ จะเป็นปัญหาสำหรับการทำแผนที่แบบ end-to-end ของการอ่าน มีเครื่องมือในการจัดการสิ่งนั้น ดังนั้น สมมติว่าคุณใช้หนึ่งในนั้นและการอ่านของคุณส่วนใหญ่ไม่ได้แมป เพื่อใส่ในประเด็นที่ดีของ WYSIWIG: อีกเหตุการณ์หนึ่งที่อาจจะทำให้การจัดตำแหน่งของคุณยุ่งเหยิงคือ การแก้ไขอาร์เอ็นเอแม้ว่าจะไม่ได้ทำให้สัดส่วนการอ่านสูงเกินไปจนไม่สอดคล้องเลยก็ตาม

เครื่องมือจัดฟันบางคนอาจ กรอง ออกจากข้อความค้นหาที่ "สั้นเกินไป" ดังนั้นตรวจสอบให้แน่ใจว่าคุณไม่ได้ใช้ข้อความค้นหาใดข้อความหนึ่ง

แล้วคุณล่ะ ประมวลผลล่วงหน้า การอ่านของคุณ? หากคุณไม่มี อาจมีลำดับอแด็ปเตอร์เหลืออยู่ หรืออาจอ่านมีคุณภาพต่ำมาก จึงยังสอดคล้องกับคุณภาพต่ำ จึงอาจถูกนับเป็นไม่สอดคล้องกัน

แล้วตรวจสอบสิ่งที่คุณกำลังจัดตำแหน่ง จีโนมพืชที่ตีพิมพ์จำนวนมากยังเป็นของ คุณภาพรองลงมารวมถึงฐานที่ยังไม่ได้มอบหมายจำนวนมาก ดังนั้น อาจมีสัดส่วนของจีโนมอ้างอิงของคุณจำนวนมากที่นับในความยาวของจีโนม แต่มีเพียง Ns และไม่มีอะไรจะจัดเรียงอยู่ที่นั่น

สุดท้ายแต่ไม่ท้ายสุด ความคิดของคุณเกี่ยวกับไวรัสก็อาจถูกต้องเช่นกัน ขึ้นอยู่กับการทดลอง อาจมี RNA ที่ทำให้เกิดโรค ในตัวอย่างของคุณ ดังนั้นให้ตรวจสอบกับฐานข้อมูลที่เหมาะสม

ถ้าปัญหาคืออ่านแค่ "สั้นเกินไป" ไม่ว่าจะด้วยเหตุผลใดก็ตาม ลองทำดู การประกอบทรานสคริปโทม ก่อนเปรียบเทียบกับการอ้างอิงของคุณ


ฉันคิดว่ามันเป็นไปไม่ได้ที่จะตอบส่วนที่ 1 โดยไม่มีข้อมูลเพิ่มเติม คุณใช้ mapper ที่รับรู้ splice เช่น Tophat หรือไม่? คุณใช้ gtf ที่กำหนดไว้ล่วงหน้ากับพิกัด exon สมมุติหรือไม่? ถ้าใช่ สำหรับพืชที่ได้รับการศึกษาอย่างดีอย่าง Arabidopsis หรือสิ่งใหม่เอี่ยมหรือไม่? คำตอบของคุณไม่ถูกต้อง อินตรอนจะสอดคล้องกับจีโนมที่ดี เครื่องมือจัดฟันไม่รู้หรือสนใจว่าลำดับเหล่านั้นไม่ควรอยู่ในตัวอย่าง ซึ่งจะไม่ส่งผลต่อการทำแผนที่ โดยส่วนตัวแล้ว ฉันไม่คิดว่าจะมีคำตอบที่ดีสำหรับคำถามนี้ การอ่านแบบสั้นไม่น่าจะล้มเหลวมากกว่าการอ่านที่ยาวขึ้น พวกเขามีแนวโน้มที่จะทำแผนที่ไปยังที่ที่ไม่ถูกต้อง แต่นั่นก็ไม่ใช่ความล้มเหลวในการทำแผนที่


การดูยีนของฉัน: พวกเขาสามารถบอกอะไรเกี่ยวกับสุขภาพจิตของฉันได้บ้าง

ความผิดปกติทางจิตคือภาวะสุขภาพที่ส่งผลต่อความคิด ความรู้สึก และการกระทำของบุคคล ความผิดปกติเหล่านี้สามารถส่งผลกระทบต่อชีวิตของบุคคลอย่างมีนัยสำคัญ รวมถึงวิธีที่พวกเขารับมือกับเหตุการณ์ในชีวิต หาเลี้ยงชีพ และเกี่ยวข้องกับผู้อื่น

“ทำไมสิ่งนี้ถึงเกิดขึ้น” นั่นเป็นคำถามทั่วไปที่ผู้ป่วยและครอบครัวมีต่อเหตุการณ์ทางจิต การพยายามฆ่าตัวตาย หรือการวินิจฉัยโรคทางจิต

การวิจัยที่ดำเนินการและได้รับทุนจากสถาบันสุขภาพจิตแห่งชาติ (NIMH) พบว่าความผิดปกติทางจิตหลายอย่างเกิดจากปัจจัยทางชีววิทยา สิ่งแวดล้อม จิตวิทยา และพันธุกรรมร่วมกัน อันที่จริง งานวิจัยจำนวนมากขึ้นเรื่อยๆ พบว่ายีนและการแปรผันของยีนบางอย่างเกี่ยวข้องกับความผิดปกติทางจิต ดังนั้นวิธีที่ดีที่สุดในการ "ดูยีนของคุณ" และกำหนดความเสี่ยงส่วนบุคคลของคุณคืออะไร?


อาการของ achondroplasia คืออะไร?

ผู้ที่มี achondroplasia มีการเจริญเติบโตของกระดูกผิดปกติที่ทำให้เกิดอาการทางคลินิกดังต่อไปนี้: ตัวเตี้ย ขาสั้น ไม่สมส่วน นิ้วสั้น หัวโต (macrocephaly) และลักษณะใบหน้าเฉพาะที่มีหน้าผากโดดเด่น ( frontal bossing) และ mid-face hypoplasia .

ความฉลาดและอายุขัยในบุคคลที่มี achondroplasia มักเป็นเรื่องปกติ

ทารกที่เกิดมาพร้อมกับ achondroplasia มักมีกล้ามเนื้ออ่อนแรง (hypotonia) เนื่องจากภาวะ hypotonia อาจมีความล่าช้าในการเดินและทักษะการเคลื่อนไหวอื่นๆ การกดทับของไขสันหลังและ/หรือสิ่งกีดขวางทางเดินหายใจส่วนบนเพิ่มความเสี่ยงต่อการเสียชีวิตในวัยเด็ก

ผู้ที่เป็นโรค achondroplasia มักมีปัญหาในการหายใจซึ่งการหายใจหยุดหรือช้าลงในช่วงเวลาสั้น ๆ (ภาวะหยุดหายใจขณะหลับ) ปัญหาสุขภาพอื่นๆ ได้แก่ โรคอ้วนและการติดเชื้อที่หูอีก ผู้ใหญ่ที่เป็นโรค achondroplasia อาจมีอาการหลังส่วนล่าง (lordosis) และขาโก่งอย่างถาวร ปัญหาเกี่ยวกับหลังส่วนล่างอาจทำให้ปวดหลังและทำให้เดินลำบาก

ผู้ที่มี achondroplasia มีการเจริญเติบโตของกระดูกผิดปกติที่ทำให้เกิดอาการทางคลินิกดังต่อไปนี้: ตัวเตี้ย ขาสั้น ไม่สมส่วน นิ้วสั้น หัวโต (macrocephaly) และลักษณะใบหน้าเฉพาะที่มีหน้าผากโดดเด่น ( frontal bossing) และ mid-face hypoplasia .

ความฉลาดและอายุขัยในบุคคลที่มี achondroplasia มักเป็นเรื่องปกติ

ทารกที่เกิดมาพร้อมกับ achondroplasia มักมีกล้ามเนื้ออ่อนแรง (hypotonia) เนื่องจากภาวะ hypotonia อาจมีความล่าช้าในการเดินและทักษะการเคลื่อนไหวอื่นๆ การกดทับของไขสันหลังและ/หรือสิ่งกีดขวางทางเดินหายใจส่วนบนเพิ่มความเสี่ยงต่อการเสียชีวิตในวัยเด็ก

ผู้ที่เป็นโรค achondroplasia มักมีปัญหาในการหายใจซึ่งการหายใจหยุดหรือช้าลงในช่วงเวลาสั้น ๆ (ภาวะหยุดหายใจขณะหลับ) ปัญหาสุขภาพอื่นๆ ได้แก่ โรคอ้วนและการติดเชื้อที่หูอีก ผู้ใหญ่ที่เป็นโรค achondroplasia อาจมีอาการหลังส่วนล่าง (lordosis) และขาโก่งอย่างถาวร ปัญหาเกี่ยวกับหลังส่วนล่างอาจทำให้ปวดหลังและทำให้เดินลำบาก


ตัวเลือกการเข้าถึง

เข้าถึงวารสารฉบับเต็มเป็นเวลา 1 ปี

ราคาทั้งหมดเป็นราคาสุทธิ
ภาษีมูลค่าเพิ่มจะถูกเพิ่มในภายหลังในการชำระเงิน
การคำนวณภาษีจะสิ้นสุดในขั้นตอนการชำระเงิน

รับสิทธิ์เข้าถึงบทความแบบจำกัดเวลาหรือแบบเต็มบน ReadCube

ราคาทั้งหมดเป็นราคาสุทธิ


การจัดลำดับดีเอ็นเอคืออะไร?

การหาลำดับหมายถึงการกำหนดลำดับที่แน่นอนของคู่เบสในส่วนของ DNA โครโมโซมของมนุษย์มีขนาดตั้งแต่ประมาณ 50,000,000 ถึง 300,000,000 คู่เบส เนื่องจากฐานมีอยู่เป็นคู่ และเอกลักษณ์ของฐานหนึ่งในคู่กำหนดสมาชิกอีกคนหนึ่งของทั้งคู่ นักวิทยาศาสตร์ไม่จำเป็นต้องรายงานทั้งสองฐานของทั้งคู่

วิธีการหลักที่ใช้โดย HGP ในการผลิตรหัสพันธุกรรมมนุษย์ฉบับสมบูรณ์คือการจัดลำดับตามแผนที่หรือแบบ BAC BAC เป็นตัวย่อสำหรับ "แบคทีเรียเทียมโครโมโซม" DNA ของมนุษย์ถูกแยกส่วนออกเป็นชิ้น ๆ ที่ค่อนข้างใหญ่แต่ยังสามารถจัดการได้ในขนาด (ระหว่าง 150,000 ถึง 200,000 คู่เบส) ชิ้นส่วนเหล่านี้ถูกโคลนในแบคทีเรีย ซึ่งเก็บและทำซ้ำ DNA ของมนุษย์ เพื่อให้สามารถเตรียมได้ในปริมาณมากเพียงพอสำหรับการจัดลำดับ หากเลือกอย่างระมัดระวังเพื่อลดการทับซ้อน จะต้องใช้สำเนา BAC ที่แตกต่างกันประมาณ 20,000 ตัวเพื่อบรรจุฐาน 3 พันล้านคู่ของจีโนมมนุษย์ คอลเล็กชันของโคลน BAC ที่มีจีโนมมนุษย์ทั้งหมดเรียกว่า "ไลบรารี BAC"

ในวิธีการที่ใช้ BAC โคลนของ BAC แต่ละตัวจะถูก "จับคู่" เพื่อกำหนดว่า DNA ในสำเนาพันธุ์ของ BAC มาจากไหนในจีโนมมนุษย์ การใช้วิธีการนี้ช่วยให้แน่ใจว่านักวิทยาศาสตร์ทราบทั้งตำแหน่งที่แม่นยำของตัวอักษร DNA ที่เรียงลำดับจากแต่ละโคลนและความสัมพันธ์เชิงพื้นที่ของพวกมันกับ DNA ของมนุษย์ที่จัดลำดับในสำเนาพันธุ์ BAC อื่นๆ

สำหรับการจัดลำดับ โคลน BAC แต่ละตัวจะถูกตัดเป็นชิ้นเล็กชิ้นน้อยที่มีความยาวประมาณ 2,000 เบส ชิ้นส่วนเหล่านี้เรียกว่า "subclones" มีการดำเนินการ "ปฏิกิริยาการจัดลำดับ" บนซับโคลนเหล่านี้ ผลิตภัณฑ์ของปฏิกิริยาการหาลำดับจะถูกโหลดลงในเครื่องจัดลำดับ (ตัวจัดลำดับ) ซีเควนเซอร์สร้างคู่เบสประมาณ 500 ถึง 800 คู่ของ A, T, C และ G จากปฏิกิริยาการหาลำดับแต่ละครั้ง เพื่อให้แต่ละเบสมีลำดับประมาณ 10 ครั้ง จากนั้นคอมพิวเตอร์จะประกอบลำดับสั้น ๆ เหล่านี้เป็นลำดับต่อเนื่องกันซึ่งเป็นตัวแทนของ DNA ของมนุษย์ในสำเนา BAC

การหาลำดับหมายถึงการกำหนดลำดับที่แน่นอนของคู่เบสในส่วนของ DNA โครโมโซมของมนุษย์มีขนาดตั้งแต่ประมาณ 50,000,000 ถึง 300,000,000 คู่เบส เนื่องจากฐานมีอยู่เป็นคู่ และเอกลักษณ์ของฐานหนึ่งในคู่กำหนดสมาชิกอีกคนหนึ่งของทั้งคู่ นักวิทยาศาสตร์ไม่จำเป็นต้องรายงานทั้งสองฐานของทั้งคู่

วิธีการหลักที่ใช้โดย HGP ในการผลิตรหัสพันธุกรรมมนุษย์ฉบับสมบูรณ์คือการจัดลำดับตามแผนที่หรือแบบ BAC BAC เป็นตัวย่อสำหรับ "แบคทีเรียเทียมโครโมโซม" DNA ของมนุษย์ถูกแยกส่วนออกเป็นชิ้น ๆ ที่ค่อนข้างใหญ่แต่ยังสามารถจัดการได้ในขนาด (ระหว่าง 150,000 ถึง 200,000 คู่เบส) ชิ้นส่วนเหล่านี้ถูกโคลนในแบคทีเรีย ซึ่งเก็บและทำซ้ำ DNA ของมนุษย์ เพื่อให้สามารถเตรียมได้ในปริมาณมากเพียงพอสำหรับการจัดลำดับ หากเลือกอย่างระมัดระวังเพื่อลดการทับซ้อน จะต้องใช้สำเนา BAC ที่แตกต่างกันประมาณ 20,000 ตัวเพื่อบรรจุฐาน 3 พันล้านคู่ของจีโนมมนุษย์ คอลเล็กชันของโคลน BAC ที่มีจีโนมมนุษย์ทั้งหมดเรียกว่า "ไลบรารี BAC"

ในวิธีการที่ใช้ BAC โคลนของ BAC แต่ละตัวจะถูก "จับคู่" เพื่อกำหนดว่า DNA ในสำเนาพันธุ์ของ BAC มาจากไหนในจีโนมมนุษย์ การใช้วิธีการนี้ช่วยให้แน่ใจว่านักวิทยาศาสตร์ทราบทั้งตำแหน่งที่แม่นยำของตัวอักษร DNA ที่เรียงลำดับจากแต่ละโคลนและความสัมพันธ์เชิงพื้นที่ของพวกมันกับ DNA ของมนุษย์ที่จัดลำดับในสำเนาพันธุ์ BAC อื่นๆ

สำหรับการจัดลำดับ โคลน BAC แต่ละตัวจะถูกตัดเป็นชิ้นเล็กชิ้นน้อยที่มีความยาวประมาณ 2,000 เบส ชิ้นส่วนเหล่านี้เรียกว่า "subclones" มีการดำเนินการ "ปฏิกิริยาการจัดลำดับ" บนซับโคลนเหล่านี้ ผลิตภัณฑ์ของปฏิกิริยาการหาลำดับจะถูกโหลดลงในเครื่องจัดลำดับ (ตัวจัดลำดับ) ซีเควนเซอร์สร้างคู่เบสประมาณ 500 ถึง 800 คู่ของ A, T, C และ G จากปฏิกิริยาการหาลำดับแต่ละครั้ง เพื่อให้แต่ละเบสมีลำดับประมาณ 10 ครั้ง จากนั้นคอมพิวเตอร์จะประกอบลำดับสั้น ๆ เหล่านี้เป็นลำดับต่อเนื่องกันซึ่งเป็นตัวแทนของ DNA ของมนุษย์ในสำเนา BAC


3. คำอธิบายเกณฑ์มาตรฐาน

3.1. ชุดข้อมูล

เครื่องมือทำแผนที่ได้รับการประเมินโดยการทดลองที่คล้ายคลึงกันสองครั้ง การทดลองแรก (มีชื่อต่อไปนี้) ดำเนินการกับจีโนมมนุษย์ (25 โครโมโซมสำหรับ 2.7 Gbp) การทดลองที่สอง (ชื่อ ) ดำเนินการกับจีโนมของแบคทีเรีย (904 ลำดับจีโนมสำหรับ 1.7 Gbp)

ในการทดลองกับจีโนมมนุษย์ ( ) จีโนมอ้างอิงถูกนำมาจากชุดประกอบ 37.1 ที่สร้างโดย NCBI เราได้สร้างชุดการอ่านสองชุด มีความยาวทั้งหมด 40 ชุด ชุดการอ่านชุดแรก ( ) ประกอบด้วยการอ่าน 10 ล้านชุดที่ดึงมาจากจีโนมอ้างอิงอย่างสม่ำเสมอ การวาดภาพเสร็จสิ้นด้วย wgsim 1 โครโมโซมมนุษย์ในบางครั้งอาจมีสัดส่วนที่มาก สูงถึง 30% ของตัวอักษร N การทำแผนที่ที่อ่านด้วย N แบบยาวนั้นเป็นข้อมูลเพียงเล็กน้อยในการประเมินประสิทธิภาพของเครื่องมือทำแผนที่ เนื่องจากการอ่านเหล่านี้ควรทำแผนที่ในหลายตำแหน่ง ดังนั้นเราจึงตัดสินใจล่วงหน้าที่จะลบการวิ่งที่ยาวกว่า 10 Ns ออกจากจีโนมอ้างอิง 2 การอ่านส่วนใหญ่ (8,877,107) จากเกิดขึ้นเพียงครั้งเดียว 3 แต่การอ่านบางส่วนสามารถทำซ้ำได้หลายครั้งตามจีโนมอ้างอิงดังแสดงในรูปที่ 8 สำหรับการอ่านที่เกิดขึ้นมากกว่าหนึ่งครั้ง จำนวนเฉลี่ยของการเกิดคือ 722.81 โดยมีมาตรฐาน ส่วนเบี่ยงเบนของ 2424.86 นอกจากนี้การอ่านบ่อยที่สุดเกิดขึ้น 53,162 ครั้ง การอ่านชุดที่สอง ( ) สร้างขึ้นจากการเพิ่มค่าที่ไม่ตรงกันสามรายการในแต่ละการอ่าน ดังนั้นจึงมีการอ่าน 10 ล้านครั้ง เราทราบดีว่าซีเควนเซอร์สมัยใหม่ไม่น่าจะสร้างการอ่านที่มีอัตราความผิดพลาดดังกล่าวได้มากนัก แต่เหตุผลของชุดข้อมูลนี้คือขณะนี้หลายโปรเจ็กต์สร้างข้อมูลการเรียงลำดับใหม่และข้อมูลเมตาเจโนมิกส์ ซึ่งอาจแตกต่างอย่างมากจากจีโนมที่จัดลำดับไว้แล้ว ตำแหน่งสำหรับสามที่ไม่ตรงกันจะถูกวาดอย่างสม่ำเสมอภายใน 40 ตำแหน่ง 4 นิวคลีโอไทด์ A, C, G หรือ T ถูกกลายพันธุ์เป็นนิวคลีโอไทด์อื่นใดในสามตัวที่มีความน่าจะเป็นเท่ากัน 1/3 ในขณะที่ N จะถูกกลายพันธุ์เป็น A, C, G หรือ T โดยมีความน่าจะเป็น 1/4 ในบรรดา 10 ล้านการอ่านจาก และ มีเพียง 49 การอ่านที่มี Ns บาง Ns จำนวน Ns ต่อการอ่านนั้นแสดงไว้ในตารางที่ 1

รูปที่. 8. ฮิสโตแกรมของลอการิทึมของจำนวนครั้งที่เกิดขึ้นของการอ่าน 1,122,893 (ตามลำดับ 2,620,394) จาก (resp. ) ที่เกิดขึ้นมากกว่าหนึ่งครั้งในจีโนมอ้างอิง (ซ้าย) (ตอบกลับ (ขวา)).

ตารางที่ 1. จำนวนการอ่านด้วยจำนวน Ns ที่กำหนด จากแต่ละชุดข้อมูลสี่ชุด , , ,

ในการทดลองที่สอง ( ) จีโนมอ้างอิงประกอบด้วยจีโนมแบคทีเรีย 904 ตัวที่พบใน Genome Reviews รีลีส 111.0 (Kersey et al., 2005) เรายังสร้างการอ่าน 40-bps สองชุด การอ่านชุดแรก ( ) ประกอบด้วยการอ่าน 10 ล้านครั้งจากการอ่านอย่างสม่ำเสมอ 5 มีการอ่าน 7,379,606 ครั้งโดยมีเหตุการณ์ที่ไม่ซ้ำกันและการอ่าน 2,620,394 ครั้งเกิดขึ้นมากกว่าหนึ่งครั้ง (เฉลี่ย 8.82 และ SD 39.03) การอ่านจากบ่อยที่สุดเกิดขึ้น 1685 ครั้ง การอ่านชุดที่สอง ( ) สร้างขึ้นโดยการเพิ่มค่าที่ไม่ตรงกันสามรายการในแต่ละการอ่านตามที่อธิบายไว้ 231 อ่านจากและ 219 อ่านจากมี Ns บางส่วน (ตารางที่ 1)

3.2. เครื่องมือทำแผนที่

เราประเมินประสิทธิภาพของเครื่องมือการทำแผนที่เก้าแบบต่อไปนี้: BWA_v0.5.8, Novoalign_v2.06.09, Bowtie_v0.12.7, SOAP_v2.20, BFAST_v0.6.5a, SSAHA2_v2.5.2, MPscan, GASSST_v1.28 และ PerM_v0.3.9

ตารางที่ 2 รวบรวมคุณลักษณะสากลของเครื่องมือ ได้แก่ ประเภทของอัลกอริธึมที่ใช้ รูปแบบเอาต์พุต ความสามารถในการอนุญาตให้ไม่ตรงกันและ/หรืออินเดลในการจัดตำแหน่ง และหากสามารถใช้หลายเธรดได้

ตารางที่ 2. ลักษณะทั่วไปของเครื่องมือการทำแผนที่

SAM แผนที่การจัดตำแหน่งลำดับ

ขณะนี้มีข้อมูลเพิ่มเติมสำหรับเครื่องมือแต่ละอย่างแยกกัน โดยเฉพาะอย่างยิ่งเกี่ยวกับวิธีการเปรียบเทียบ สำหรับแต่ละเครื่องมือ เป้าหมายของเราคือดึงข้อมูลการจัดตำแหน่งทั้งหมด (ซึ่งเรียกว่า Hit ต่อจากนี้) โดยที่ไม่ตรงกันหรือไม่ตรงกันมากที่สุด 3 ชุดของชุดข้อมูลที่อ่านของเรา (ดูหัวข้อ 3.1)

3.2.1. BWA

การรัน BWA ประกอบด้วยการใช้คำสั่งสามคำสั่งติดต่อกัน: คำสั่งแรก (ดัชนี bwa) จัดทำดัชนีจีโนมอ้างอิง คำสั่งที่สอง (bwa aln) ค้นหาพิกัดของจำนวนการตีแต่ละรายการที่อ่านในอาร์เรย์ต่อท้าย และคำสั่งสุดท้าย (bwa samse) ) แปลงพิกัดอาร์เรย์ต่อท้ายเป็นพิกัดจีโนมอ้างอิงและสร้างการจัดตำแหน่งในรูปแบบ SAM โดยค่าเริ่มต้น การค้นหาแบบไม่ละเอียดจะดำเนินการในขั้นตอนที่ 2 เพื่อลดเวลาในการคำนวณ จากนั้นจึงใช้ตัวเลือก −N เพื่อปิดการทำงานนี้และเพื่อค้นหา Hit ที่เป็นไปได้ทั้งหมด การใช้ตัวเลือกนี้หรือไม่มีผลอย่างมากต่อผลลัพธ์เมื่ออนุญาตให้ไม่ตรงกัน ดังที่เราจะเห็นในหัวข้อถัดไป เป็นไปได้ที่จะกำหนดจำนวนสูงสุดของการจับคู่ที่ไม่ตรงกัน (ตัวเลือก −n ในขั้นตอนที่สอง) และสำหรับแต่ละเมล็ด (ตัวเลือก −k) เราใช้ค่าเดียวกันสำหรับพารามิเตอร์ทั้งสอง นอกจากนี้ ยังสามารถระบุจำนวนสูงสุดของ Hit ที่จะส่งออกได้ (ตัวเลือก −n ในขั้นตอนที่สาม) หากการอ่านมี Hit มากกว่าในการอ้างอิง Hit ที่ส่งออกจะถูกสุ่มเลือก วิธีเดียวที่จะได้ Hit ทั้งหมดต่อการอ่านคือกำหนดจำนวนสูงสุดของ Hit ที่จะส่งออกเป็นค่าที่มากกว่าจำนวนครั้งสูงสุดของการอ่านในแต่ละชุดการอ่าน จากนั้นเราใช้ขอบเขต 54,000 สำหรับ และ , 6 และ 2,000 สำหรับ และ 7 BWA สุ่มเปลี่ยน Ns ในจีโนมอ้างอิงเป็นนิวคลีโอไทด์ปกติ

3.2.2. Novoalign

การรัน Novoalign ประกอบด้วยการรันคำสั่งสองคำสั่งที่ต่อเนื่องกัน: คำสั่งแรก (novoindex) จะทำดัชนีจีโนมอ้างอิง และคำสั่งที่สอง (novoalign) จะจัดตำแหน่งการอ่านเทียบกับการอ้างอิงที่จัดทำดัชนีไว้ Novoalign (อย่างน้อยในเวอร์ชันวิชาการ) ไม่อนุญาตให้ผู้ใช้ตั้งค่าจำนวนที่ไม่ตรงกันสูงสุด (หรือที่แน่นอน) ระหว่างการอ่านและจีโนมอ้างอิง จากนั้น เราประมวลผลผลลัพธ์เพื่อดึงข้อมูลที่ตรงกัน ( และ ) หรือจับคู่กับรายการที่ตรงกันมากที่สุดสามรายการ ( และ ) สำหรับการอ่านที่มีหลาย Hit เป็นไปได้ที่จะรายงาน Hit ทั้งหมด (ตัวเลือก −r A) หรือจำนวน Hit ที่เลือกแบบสุ่มสูงสุด

3.2.3. หูกระต่าย

Running Bowtie ประกอบด้วยการใช้คำสั่งสองคำสั่งอย่างต่อเนื่อง คือ bowtie-build ซึ่งสร้างดัชนีจีโนมอ้างอิงและ bowtie ซึ่งรับดัชนีและชุดของการอ่านเป็นอินพุตและเอาต์พุตรายการการจัดตำแหน่ง Bowtie อนุญาตให้ผู้ใช้กำหนดจำนวนสูงสุดของการไม่ตรงกันต่อการโจมตี (ตัวเลือก −v) ตามค่าเริ่มต้น Bowtie จะส่งกลับเพียงหนึ่ง Hit ต่อการอ่าน หากเราต้องการเรียกข้อมูล Hit เพิ่มเติมหรือทั้งหมดต่อการอ่านหนึ่งครั้ง จำเป็นต้องระบุจำนวนสูงสุดของ Hit ที่จะรายงาน (ตัวเลือก −k) สำหรับ BWA จำนวนสูงสุดนี้ควรตั้งค่าเป็นจำนวนครั้งสูงสุดของชุดการอ่าน 8 เพื่อดึงข้อมูล Hit ทั้งหมด การจัดแนวที่เกี่ยวข้องกับอักขระที่คลุมเครือตั้งแต่หนึ่งตัวขึ้นไป เช่น Ns ในข้อมูลอ้างอิงจะถือว่า Bowtie ใช้งานไม่ได้ ในขณะที่จะพิจารณาถึงความไม่ตรงกันหากอยู่ในการอ่าน

3.2.4. SOAP2

การรัน SOAP2 ประกอบด้วยการใช้สองคำสั่งอย่างต่อเนื่อง: คำสั่งแรก (2bwt-builder) สร้างดัชนี Burrows-Wheeler ของจีโนมอ้างอิง และคำสั่งที่สอง (สบู่) ดำเนินการจัดตำแหน่ง SOAP2 อนุญาตให้ผู้ใช้กำหนดจำนวนสูงสุดของการไม่ตรงกันต่อ Hit (ตัวเลือก −v) แต่จำนวนสูงสุดนี้จำกัดที่ 2 SOAP2 จะส่งออก Hit ทั้งหมดอย่างเป็นระบบ (ไม่อนุญาตให้มีข้อจำกัด) สามารถรับการอ่านที่ไม่ได้แมปได้ในไฟล์ FASTA SOAP2 ดูเหมือนว่าจะแทนที่ N ทั้งหมดในการอ่านโดย G

3.2.5. BFAST

การรัน BFAST ต้องใช้ห้าขั้นตอน: (1) จีโนมอ้างอิงถูกเขียนใหม่ในรูปแบบพิเศษก่อน (bfast fasta2brg), (2) ดัชนี bfast จัดทำดัชนีจีโนมอ้างอิงโดยใช้เมล็ดเว้นระยะที่กำหนดโดยผู้ใช้ (ขั้นตอนนี้ควรทำด้วยหลาย Seeds ซึ่งนำไปสู่ดัชนีหลายรายการ เราใช้ 10 เมล็ดที่เสนอใน Homer et al., [2009]), (3) จากนั้นคำสั่ง bfast match จะใช้ชุดการอ่านและค้นหาชุดดัชนีเพื่อค้นหาตำแหน่งการจัดตำแหน่งผู้สมัคร (หรือ CAL) สำหรับการอ่านแต่ละครั้ง (4) คำสั่ง bfast localalign ใช้ CAL สำหรับการอ่านแต่ละครั้งและดำเนินการจัดตำแหน่งภายในเครื่องเพื่ออ้างอิง และ (5) ในที่สุด ไฟล์เอาต์พุตจะถูกสร้างขึ้น (bfast postprocess) สำหรับ Novoalign ผู้ใช้ไม่สามารถตั้งค่าจำนวนที่ไม่ตรงกันสูงสุด (หรือที่แน่นอน) ได้ ดังนั้นเราจึงประมวลผล Hit ที่ส่งออกไปภายหลัง BFAST สามารถส่งออก Hit ทั้งหมดได้ (ตัวเลือก −a)

3.2.6. SSAHA2

การรัน SSAHA2 ประกอบด้วยสองขั้นตอน: การทำดัชนีจีโนมอ้างอิง (คำสั่ง ssaha2Build) และการแมปการอ่าน (ssaha2) เป็นไปได้ที่จะระบุจำนวนที่ไม่ตรงกันที่อนุญาตหรือเทียบเท่าเปอร์เซ็นต์ของข้อมูลประจำตัว (ตัวเลือก −identity) จำนวน Hit ที่รายงานต่อการอ่านถูกจำกัดที่ 500 และไม่สามารถเปลี่ยนแปลงได้ เราขอการแมปที่ "ดีที่สุด" (คะแนน Smith-Waterman) สำหรับการอ่านแต่ละครั้ง (−ดีที่สุด 1) ซึ่งดูเหมาะสมสำหรับการทำแผนที่ที่แน่นอน แต่อาจไม่ใช่สำหรับ และ (จริงๆ แล้วเราใช้ −best 0 ในกรณีที่ไม่ตรงกันด้วย)

3.2.7. MPscan

ในการรัน MPscan มีเพียงคำสั่งเดียว (mpscan) แต่ต้องใช้สองครั้ง คำสั่งหนึ่งสำหรับการทำแผนที่บนสายตรง และคำสั่งที่สองสำหรับสายย้อนกลับ (ตัวเลือก −rev −ac) ไม่อนุญาตให้ไม่ตรงกันในการจัดตำแหน่งและการจัดตำแหน่งทั้งหมดจะถูกรายงานในไฟล์เอาต์พุต (ไม่ใช่ในรูปแบบ SAM)

3.2.8. GASSST

ขั้นตอนการจัดทำดัชนีและการทำแผนที่ทำได้โดยใช้คำสั่ง Gassst เป็นไปได้ที่จะระบุจำนวนที่ไม่ตรงกันที่อนุญาตหรือเทียบเท่าเปอร์เซ็นต์ของข้อมูลประจำตัว (ตัวเลือก −p) ในการดึงข้อมูล Hit ทั้งหมดอย่างละเอียดสำหรับการอ่านแต่ละครั้ง เราได้ปิดใช้งานกระบวนการกรองที่ใช้โดยค่าเริ่มต้นเพื่อลดเวลาในการคำนวณ (ตัวเลือก −l 0) และเราตั้งค่าความไวเป็นค่าสูงสุด (ตัวเลือก −s 5) การจัดตำแหน่งที่เกี่ยวข้องกับอักขระที่คลุมเครือจำเป็นต้องพิจารณาความไม่ตรงกัน GASSST รายงานการจัดตำแหน่งในรูปแบบเฉพาะที่ไฟล์เอาต์พุตสามารถแปลงเป็นรูปแบบ SAM ได้โดยใช้คำสั่ง gassst_to_sam ซึ่งดูเหมือนจะใช้เวลานานมาก

3.2.9. PerM

ขั้นตอนการทำดัชนีและการแม็พทำได้โดยการรันคำสั่ง perm เป็นไปได้ที่จะกำหนดจำนวนสูงสุดของการไม่ตรงกันต่อการโจมตี (ตัวเลือก −s) และระบุจำนวนครั้งสูงสุดที่จะค้นหา (ตัวเลือก −k) ในการรายงาน Hit ทั้งหมด เราได้ตั้งค่าตัวเลือกก่อนหน้าเป็นจำนวนครั้งสูงสุดที่พบในชุดการอ่านของเรา (สำหรับ Bowtie และ BWA) และเรายังเปิดใช้งานตัวเลือก "ทั้งหมด" −A ด้วย สุดท้าย เนื่องจากการอ่านบางส่วนมี Ns (ตารางที่ 1) เราจึงใช้ตัวเลือก ––includeReadsWN ตามด้วย 40, 37 หรือ 10 ขึ้นอยู่กับชุดการอ่าน


วัสดุและวิธีการ

ลำดับ

ลำดับของ บาซิลลัส ซับทิลิส จีโนมถูกดำเนินการโดยใช้ Illumina GA II จีโนม DNA ของ ข. ซับทิลิส สกัดด้วย DNeasy Blood and Tissue kit (Qiagen) ห้องสมุดของ DNA จีโนมนี้จัดทำขึ้นตามโปรโตคอลของผู้ผลิต (Illumina) (8) จีโนม DNA ห้าไมโครกรัมถูกแยกส่วนให้มีความยาวเฉลี่ย 200 bp โดยใช้ระบบ Covaris S2 (Covaris) DNA ที่กระจัดกระจายได้รับการซ่อมแซมโดยใช้ T4 polynucleotide kinase และ Klenow fragment (New England Biolabs) ที่ 3′-end ของ DNA ที่ซ่อมแซมปลายถูก adenylated โดยใช้ Klenow fragment (New England Biolabs) ถัดไป อะแดปเตอร์ Index PE Oligo Mix (Illumina) ถูกมัดกับชิ้นส่วนโดยใช้ Quick T4 DNA Ligase (New England Biolabs) ส่วนขยายอะแด็ปเตอร์ 5′-end และการตกแต่งของไลบรารีถูกดำเนินการโดยใช้ PCR 18 รอบกับไพรเมอร์ InPE1.0, InPE2.0 และไพรเมอร์ดัชนี PCR (Illumina) ดำเนินการสร้างคลัสเตอร์บนสถานีคลัสเตอร์ Illumina โดยใช้ Paired-End Cluster Generation Kit v4 เจ็ดสิบหกรอบของการเรียงลำดับปลายคู่แบบมัลติเพล็กซ์ดำเนินการโดยใช้ระบบ Illumina GA II ที่มี SBS 36-cycle Sequencing Kit v4 ตามข้อกำหนดของผู้ผลิต หลังจากปฏิกิริยาการจัดลำดับเสร็จสมบูรณ์ ไปป์ไลน์การวิเคราะห์ Illumina (CASAVA 1.6.0) ถูกใช้เพื่อประมวลผลข้อมูลการจัดลำดับดิบ ลำดับอ้างอิงของการทำแผนที่คือ ข. ซับทิลิส str. 168 (NC_000964.3) ข้อมูลที่อ่าน (DRX000504) ถูกฝากไว้ใน DRA (DDBJ Sequence Read Archive)

การวิเคราะห์ข้อมูล

เราได้สร้างโปรแกรมซอฟต์แวร์ใหม่สำหรับการทำแผนที่ Illumina sequencer read (MPSmap) และการแสดงภาพผลลัพธ์การทำแผนที่ (PSmap) คำอธิบายโดยละเอียดและการประเมินซอฟต์แวร์จะปรากฏที่อื่นที่นี่ เราอธิบายวิธีการของเราโดยสังเขป เริ่มแรก ดัชนีอย่างง่ายของ k -mers ถูกเตรียมไว้สำหรับลำดับอ้างอิง จากนั้นจึงเปรียบเทียบฐานของการอ่านทั้งหมดกับข้อมูลอ้างอิงสำหรับการจับคู่ดัชนีแต่ละรายการของการอ่าน การเปรียบเทียบนี้ดำเนินการสำหรับการจับคู่ดัชนีทั้งหมด และระบุตำแหน่งที่ตรงกันที่สุดสำหรับการอ่านแต่ละครั้ง ข้อจำกัดของแนวทางดัชนีคือตำแหน่งที่ใกล้เคียงกันบางตำแหน่งอาจไม่ได้รับการระบุหากมีความไม่ตรงกันภายในดัชนี เพื่อลดปัญหานี้ เราค้นหาดัชนีซ้ำในขณะที่เปลี่ยนตำแหน่งดัชนีตามลำดับการอ่าน ตัวอย่างเช่น เราค้นหาดัชนีซ้ำสามครั้งเพื่อค้นหาตำแหน่งการอ่านอย่างถูกต้องในขณะที่ปล่อยให้สองรายการไม่ตรงกัน ในทำนองเดียวกัน เราค้นหาดัชนีซ้ำ ( NS + 1) ครั้ง โดยที่ NS คือจำนวนที่ไม่ตรงกันต่อการอ่านที่อนุญาตในการค้นหา แต่ละ Hit ของดัชนีจะอยู่ในแนวเดียวกับข้อมูลอ้างอิงเพื่อค้นหาตำแหน่งที่ดีที่สุด ซึ่งทำให้มีการจับคู่ที่ไม่ตรงกันตามจำนวนที่ระบุโดยไม่มีช่องว่าง วิธีดัชนีนั้นรวดเร็วแต่ไม่รับประกันความไวสำหรับการอ่านที่สั้นกว่า k ( NS + 1) ที่ไหน k คือความยาวดัชนี สำหรับการทำแผนที่ของ ข. ซับทิลิส อนุญาตให้ไม่ตรงกัน 35 รายการ เราเปรียบเทียบการค้นหากับความยาวดัชนีของ k = 2 และ k = 10 เพื่อยืนยันว่าผลต่างมีน้อย ( ตารางเสริม S1 ) เรายังทำแผนที่ด้วย BWA และ BFAST โดยใช้แท็บเล็ต ( 29 ) สำหรับการแสดงภาพด้วย เพื่อยืนยันว่าอัลกอริธึมการทำแผนที่หลายตัวตรวจพบ SSE (ข้อมูลเสริม S1 ) โปรแกรมสร้างภาพ (PSmap) แปลงผลลัพธ์การแมปเป็นไฟล์ PostScript โปรแกรมที่สามารถเรียกทำงานได้บนระบบ Linux (CentOS5.3) และ MacOSX (เวอร์ชั่น 10.6.6) สามารถดาวน์โหลดได้บนเว็บไซต์ของเรา ( http://metalmine.naist.jp/maps/ )

ข้อมูลสาธารณะ

เราวิเคราะห์ชุดข้อมูลสาธารณะหลายชุดที่ดาวน์โหลดจากเซิร์ฟเวอร์ฐานข้อมูล SRA ที่ศูนย์ข้อมูลเทคโนโลยีชีวภาพแห่งชาติ (NCBI) หมายเลขภาคยานุวัติของตัวอย่างเหล่านี้และลำดับอ้างอิงที่สอดคล้องกันคือ ERX006616 (NC_02945.3 มัยโคแบคทีเรียม โบวิส AF2122/97), SRX007714 (NC_010079, NC_012417.1 และ NC_010063.1 Staphylococcus aureus USA300) และ ERX002218 (NC_002929.2 Bordetella ไอกรน โทฮามะ I)


เชิงนามธรรม

การจัดลำดับแบบเรียลไทม์โมเลกุลเดี่ยวที่พัฒนาโดย Pacific BioSciences ให้ความยาวในการอ่านนานกว่าเทคโนโลยีการจัดลำดับรุ่นที่สอง (SGS) ทำให้เหมาะสำหรับปัญหาที่ยังไม่แก้ในการวิจัยจีโนม การถอดรหัส และอีพีเจเนติกส์ มีความต่อเนื่องกันสูง เดอโนโว แอสเซมบลี การใช้การจัดลำดับ PacBio สามารถปิดช่องว่างในชุดอ้างอิงปัจจุบันและกำหนดลักษณะการแปรผันของโครงสร้าง (SV) ในจีโนมส่วนบุคคล ด้วยการอ่านที่ยาวขึ้น เราสามารถจัดลำดับผ่านบริเวณที่มีการทำซ้ำที่ขยายออกไปและตรวจจับการกลายพันธุ์ ซึ่งส่วนมากเกี่ยวข้องกับโรคต่างๆ นอกจากนี้ การจัดลำดับทรานสคริปโทมของ PacBio ยังเป็นประโยชน์สำหรับการระบุไอโซฟอร์มของยีน และอำนวยความสะดวกในการค้นพบยีนใหม่และไอโซฟอร์มใหม่ของยีนที่มีคำอธิบายประกอบได้อย่างน่าเชื่อถือ เนื่องจากความสามารถในการจัดลำดับการถอดเสียงหรือชิ้นส่วนที่มีความยาวเต็มจำนวน นอกจากนี้ เทคนิคการเรียงลำดับของ PacBio ยังให้ข้อมูลที่เป็นประโยชน์สำหรับการตรวจจับการแก้ไขพื้นฐานโดยตรง เช่น เมทิลเลชั่น. นอกจากการใช้ PacBio sequencing เพียงอย่างเดียวแล้ว ยังมีอีกมาก การจัดลำดับแบบไฮบริด กลยุทธ์ได้รับการพัฒนาเพื่อใช้การอ่านสั้นที่แม่นยำยิ่งขึ้นร่วมกับการอ่านแบบยาวของ PacBio โดยทั่วไปแล้ว การจัดลำดับแบบไฮบริด กลยุทธ์มีราคาไม่แพงและสามารถปรับขนาดได้โดยเฉพาะสำหรับห้องปฏิบัติการขนาดเล็กกว่าการใช้ PacBio Sequencing เพียงอย่างเดียว การถือกำเนิดของการจัดลำดับ PacBio ทำให้มีข้อมูลมากมายที่ไม่สามารถรับผ่าน SGS เพียงอย่างเดียวได้


การอภิปราย

ความก้าวหน้าล่าสุดในเทคโนโลยีการจัดลำดับนำเสนอโอกาสในการดำเนินการหาลำดับจีโนมทั้งหมดของสายพันธุ์ในห้องปฏิบัติการอย่างรวดเร็วและด้วยต้นทุนที่ต่ำ ทำให้สามารถตรวจหาความแตกต่างทางพันธุกรรมระหว่างสายพันธุ์ในระดับโมเลกุลได้อย่างมีประสิทธิภาพ นอกจากนี้ เทคโนโลยีการจัดลำดับใหม่ยังเปิดโอกาสให้พัฒนาแอปพลิเคชันใหม่และ/หรือทำให้การทดลองที่ลำบากก่อนหน้านี้ง่ายขึ้นอย่างมาก เช่น การตรวจจับการกลายพันธุ์แบบจุด ในรายงานนี้ เราได้สำรวจอรรถประโยชน์บางประการของวิธีการจัดลำดับรุ่นต่อไปสำหรับการทำความเข้าใจชีววิทยาของแบคทีเรียที่ได้รับการศึกษาเป็นอย่างดี— ข. ซับทิลิส. เราแสดงให้เห็นว่า Solexa แพลตฟอร์มการจัดลำดับปืนลูกซองใหม่ ซึ่งอ่านชิ้นส่วน DNA สั้นจำนวนมาก สามารถใช้เพื่อรับข้อมูลจีโนมหลายประเภทจากสายพันธุ์ในห้องปฏิบัติการของ ข. ซับทิลิส. ประการแรก เทคโนโลยีนี้ใช้ได้กับการตรวจจับการกลายพันธุ์อย่างง่ายดาย ได้รับลำดับจีโนมของสายพันธุ์ที่ใช้กันอย่างแพร่หลาย JH642, 168, SMY และ NCIB 3610 และระบุการกลายพันธุ์ที่รู้จักตลอดจนการเปลี่ยนแปลงที่ไม่รู้จักก่อนหน้านี้ ผลลัพธ์เหล่านี้บ่งชี้ว่าการจัดลำดับโดยตรงเป็นวิธีที่ละเอียดอ่อนและแม่นยำสูงสำหรับการตรวจจับการแทนที่ฐานเดี่ยว ประการที่สอง เราตรวจพบการลบขนาดใหญ่ 18 kb และ 9 kb รวมถึงการลบยีนเดี่ยว (relA) ในสายพันธุ์ที่ได้มาจาก JH642 ที่สำคัญที่สุด วิธีนี้ช่วยให้สามารถระบุการกลายพันธุ์ของซับเพรสเซอร์หลายตัวในสายพันธุ์เดียวได้ และด้วยเหตุนี้จึงเป็นเครื่องมือที่มีประสิทธิภาพในการแก้ปัญหาการระบุตัวต้านได้ยาก

การจัดลำดับโดยตรงเป็นเครื่องมือใหม่และการปรับปรุงเพิ่มเติม

ความพยายามอย่างมากที่เราทำขณะประมวลผลข้อมูลลำดับคือการบรรลุความถูกต้อง โดยการรวมวิธีการประกอบลำดับอิสระ (MAQ, SOAP และ Edena) เพื่อประมวลผลการอ่านจากเครื่องวิเคราะห์จีโนม จากนั้นเราตรวจสอบและเสริมผลลัพธ์ด้วยการสุ่มตัวอย่างด้วยการจัดลำดับ Sanger และการตรวจสอบการทดลองอย่างละเอียด

อัปเดตฉบับร่างของลำดับอ้างอิง 168

การเรียงลำดับใหม่ของจีโนมอ้างอิง 168 รายการของเราเผยให้เห็นการแทนที่ฐาน � นอกเหนือจากการแทรกและการลบ เราสามารถทดสอบความถูกต้องของการอ่าน Solexa ได้หลายวิธีและแยกแยะข้อผิดพลาดในการจัดลำดับ Solexa ว่าเป็นสาเหตุที่เป็นไปได้ของความแตกต่างเหล่านี้ ไม่น่าแปลกใจเพราะร่างต้นฉบับถูกตีพิมพ์มานานกว่าทศวรรษที่ผ่านมา [4] นอกจากนี้ เราสังเกตเห็นว่าการสูญเสีย isogenicity ระหว่างการแยกอิสระของสายพันธุ์เดียวกันนั้นไม่สูงพอที่จะอธิบายความคลาดเคลื่อนที่สังเกตได้ นอกจากนี้เรายังเปิดเผยบริเวณที่มีความแปรปรวนของลำดับที่สูงขึ้น ซึ่งน่าจะเกิดจากความแตกต่างของความเครียดในส่วนของ DNA ที่ใช้ในกลุ่มการจัดลำดับปี 1997 (Danchin A, การสื่อสารส่วนบุคคล) ดังนั้นเราจึงสรุปได้ว่าลำดับการอ้างอิงสามารถอัปเดตตามผลลัพธ์ Solexa ของเรา (หมายเลขการเข้าถึงโครงการ DDBJ/EMBL/GenBank <"type":"entrez-nucleotide","attrs":<"text":"ABQK00000000","term_id ":"195984424">> ABQK00000000) เวอร์ชันนี้ไม่รวมความแตกต่างบางอย่างที่เราสังเกตเห็นในโอเปอรอน RNA ของไรโบโซม เนื่องจากสิ่งเหล่านี้ไม่สามารถจับคู่ได้ด้วยการจัดลำดับปืนลูกซองเพียงอย่างเดียว นอกเหนือจากฉบับร่างของเราแล้ว การอัปเดตฉบับสมบูรณ์และมีคำอธิบายประกอบของลำดับ 168 ที่เผยแพร่ก่อนหน้านี้ [4] อยู่ในระหว่างจัดทำและจะเป็นประโยชน์ต่อ ข. ซับทิลิส ชุมชนอย่างมาก (Danchin A, ไม่ได้เผยแพร่).

อ่านความคุ้มครองและ CGH

Comparative Genome Hybridization (CGH) เป็นเทคโนโลยีที่ใช้ microarray สำหรับศึกษาการจัดเรียงใหม่ของจีโนมรวมถึงการทำซ้ำและการลบในสิ่งมีชีวิตหลายชนิด และถูกนำมาใช้เพื่อศึกษาสถานะการจำลองดีเอ็นเอในแบคทีเรีย ได้แก่ อี. โคไล และ ข. ซับทิลิส [32],[33]. ขณะตรวจสอบความครอบคลุมของลำดับ เราพบว่าการจัดลำดับโดยตรงและการนับความครอบคลุมการอ่านให้ทางเลือกแทน microarray hybridization เป็นวิธีการ CGH ( รูปที่ 1 ) ซึ่งหลีกเลี่ยงปัญหาอันเนื่องมาจากการผสมข้ามพันธุ์แบบไม่เฉพาะเจาะจงในวิธี microarray ความครอบคลุมในการอ่านคือจำนวนของชิ้นส่วน DNA สั้นๆ ที่เครื่องวิเคราะห์จีโนมอ่าน และตัวเลขนี้ควรเป็นสัดส่วนกับจำนวนชิ้นส่วน DNA ที่บริเวณจีโนมเฉพาะที่มีอยู่ใน DNA อินพุต รูปร่างของเส้นโค้งความครอบคลุมในการอ่านจะแตกต่างกันไปตามสภาพการเจริญเติบโต และเกือบจะแบนสำหรับเซลล์เฟสที่อยู่กับที่ (รูปที่ 1A, C, D, E ) ซึ่งบ่งชี้ว่าเซลล์เหล่านี้มี DNA ที่จำลองแบบอย่างสมบูรณ์ตามที่คาดไว้ สิ่งที่น่าสนใจคือ ความครอบคลุมนั้นสูงขึ้นเล็กน้อยรอบๆ ต้นทางการจำลองแบบ และต่ำที่สุดใกล้กับตัวยุติการจำลองแบบ น่าจะเป็นเพราะว่าจำนวนเซลล์ย่อยเล็กๆ ยังคงจำลอง DNA อยู่ ที่สำคัญ ในตัวอย่างที่จำลองแบบอย่างแข็งขัน ( รูปที่ 1B, F ) เราพบว่ามีการครอบคลุมการอ่านที่สูงกว่ามากใกล้กับจุดกำเนิด (ที่ตำแหน่งจีโนม 0/4.2 Mbp) มากกว่าบริเวณปลายทาง (ที่ตำแหน่งจีโนม 2.1 Mbp) ที่ความละเอียดที่สูงขึ้น เราสังเกตเห็นสัญญาณรบกวนในพื้นที่ครอบคลุม ซึ่งสอดคล้องกับเนื้อหา AT ที่แตกต่างกัน เราไม่ทราบว่าการเพิ่มประสิทธิภาพของลำดับ AT แบบเฉพาะเจาะจงนี้เกิดขึ้นที่ขั้นตอนใด อย่างไรก็ตาม สิ่งนี้สามารถถูกกำจัดได้หากเราใช้แผนที่ความครอบคลุมของเฟสที่อยู่นิ่งเป็นข้อมูลอ้างอิงเพื่อแก้ไขเนื้อหา AT และรูปแบบอื่นๆ ที่ไม่รู้จัก ความครอบคลุมในการอ่านยังให้ข้อมูลที่ถูกต้องและมีความละเอียดสูงเกี่ยวกับการลบ แม้กระทั่งจนถึงระดับยีนเดี่ยว ดังที่แสดงโดย relA- ( รูปที่ 1E, F และสิ่งที่ใส่เข้าไป ).

การจัดกลุ่มของการกลายพันธุ์

ผลการจัดลำดับของเราเผยให้เห็นบริเวณที่มีความหนาแน่นสูงของการแปรผันของลำดับระหว่างสายพันธุ์ที่เกี่ยวข้อง (รูปที่ S1) ภูมิภาคเหล่านี้อาจเกิดขึ้นได้สองวิธี ประการแรก ภูมิภาคเหล่านี้อาจเปลี่ยนแปลงได้สูง Regions of hyper-mutability have been visualized before [34] and whole-genome sequencing methods might accelerate the characterization of these changes, effectively facilitating efforts to understand the mechanisms of genomic instability, an important factor in tumorigenesis. Second and more likely, these regions might correspond to DNA of foreign origin. For example, we observed changes clustered in a 4 kb region that were likely to have arisen by horizontal gene transfer during the genetic manipulation to obtain JH642 (Figure S1). These changes are very difficult to find with traditional methods but can be easily identified by plotting the mutation distribution as shown in Figure S1. In addition, we found that the majority of the differences between 168 and SMY were located within a 6.4 kb span that includes the trpC-D-E, aroH-B-F และ cheR genes (Figure S1). This heterogeneous cluster was identified previously by the comparison of two laboratory strains (L1437 and JH642) by microarray analysis [35],[36], and is shown to be acquired by horizontal transfer of DNA from a related บาซิลลัส strain (Zeigler D, unpublished). We found that the genomic sequences of NCIB 3610 and 168 were highly similar, suggesting that they are closely related, supporting results from an independent study showing that NCIB 3610 is most likely the ancestor of 168 (Zeigler D, personal communication).

There are certain limitations to our current method. For example, while using MAQ to perform variant identification, we eliminated false positives by raising the quality score cutoff to 40. This cutoff score was chosen empirically, by shuffling and randomly dividing the Solexa sequence reads of one genome, calling the sequences independently, comparing independent calls and choosing a score that did not give any discrepancies ( Figure 2 ). We verified that the scores obtained by MAQ were very close to the Phred scores, indicating that score 40 meant that the error rate was 0.01%. If all bases had a score of 40, we would expect � errors per genome (0.01 errors for every 100 bases of the 𢏄 megabase genome). However, since most bases had scores much higher than 40, the final number of errors per genome is much closer to 0. This helped us to limit false positives so that almost all changes that we identified were bona-fide genetic differences. When this cutoff value was lowered, we obtained dramatically increased false positives. However, as a trade-off, we might not have been able to identify certain existing changes that had lower quality scores. It is also possible that the error rate we obtained might be an underestimate if there are systematic errors, although we did not identify any systematic errors while verifying our results by Sanger sequencing. In addition, although our shotgun sequencing originally identified a large number of insertions and deletions, many of these were not included in our current draft sequence since we used a high threshold to prevent the inclusion of false positives. If these changes are real, they are likely to have significant impacts including the disruption of open reading frames, which sometimes results in dominant negative or null alleles. Verification of these changes will lead to further updated versions. Similarly, certain large deletions are also not reflected in our present draft. Our current approach is also insufficient for detecting heterogeneities, such as mutation rates, in a given cell population. This is because the inherent error rate of each read is higher than the spontaneous mutation rate in cells, while each sequence call is based on the majority consensus. Despite these potential limitations, we were able to obtain a considerable number of genetic insights using whole genome shotgun sequencing. Finally, with the improvement of sequence analysis software and wider use of de novo sequence assembly programs, this method can be used to detect additional types of mutations, including DNA rearrangements.

Genome Diversity and Phenotypic Variations between Laboratory Strains

ข. ซับทิลิส is one of the most extensively investigated Gram-positive bacteria. Microarray-based comparative genomic hybridization (M-CGH) studies have demonstrated that there is considerable genome diversity within naturally occurring populations of ข. ซับทิลิส strains collected from diverse geographic locations [19]. Much of the diversity was attributed to genes required for phage-related functions or those which were likely acquired by horizontal transfer. Other genes that were found to diverge significantly included those that encoded environmental sensors, detoxifying enzymes and proteins involved in antibiotic production. Essential metabolic functions were mostly encoded by less divergent genes in different populations of ข. ซับทิลิส. Overall, as many as 28% of the genes in these strains were found to be significantly different from 168. However, between the two cultivated ข. ซับทิลิส strains 168 and NCIB 3610, M-CGH studies revealed almost no significant sequence divergence [19]. The whole genome sequences of ข. ซับทิลิส and its close relatives that have evolved in nature are available [37] (http://www.bacillusgenomics.org/bsubtilis).

Using whole genome sequencing to achieve near-complete coverage, we compared, base by base, the differences between related laboratory strains that have 𠆎volved’ in different laboratories, and between independent isolates of several strains. We confirmed that the genomes of 168 and NCIB 3610 have few base differences, and that NCIB 3610 possesses an extra-chromosomal plasmid, that we named pAS32 [19]. We also found that individual isolates of the same strain appear to be quite isogenic, differing by only tens of bases. In particular, two different isolates of JH642 utilized in different laboratories only diverge by 𢏆 bases (The actual difference between the isolates might be even smaller, since we sequenced only a single colony per isolate after streaking it out on LB plates, potentially introducing further mutations). Among these 6 variants, only 3 are missense mutations, and they are in the genes yckJ, phoB and ylmF, which encode a putative L-cystine permease, a secreted protein induced by phosphate starvation, and a hypothetical cell division protein, respectively. We have not examined the possible phenotypic differences resulting from these three missense mutations, and it remains possible that there may not be any phenotypic differences between the two isolates of JH642. Such studies provide a reasonable framework for estimating the reproducibility of experimental results obtained with independently propagated isolates.

We further discovered that several laboratory strains that are reportedly related also display tens to hundreds of base differences and insertions and deletions, including regions of horizontal transfer. Some of the variations we identified lead to phenotypic differences. For example, we discovered a novel defect in the citrate signal transduction pathway of JH642. citS encodes the histidine kinase sensor of a two-component system regulating the transport of citrate into ข. ซับทิลิส. JH642, unlike its ancestral strains, has a loss of function mutation in citS, leading to the inability to utilize citrate as a carbon source. The revelation and our subsequent experimental verification of this defect demonstrate the power of whole-genome sequencing.

Tripartite Genetic Interaction between (p)ppGpp Synthases in ข. ซับทิลิส

ข. ซับทิลิส is a powerful model system to identify genetic pathways. One common approach to identify components of a given genetic pathway is through genetic modifier screens- enhancer and suppressor screens. However, identification of the molecular nature of the mutations obtained in a genetic screen is often laborious. Furthermore, in some cases, it can be difficult to identify mutations using traditional genetic mapping for example, in the absence of an expression library or when the phenotype observed is due to the combinatorial effect of multiple mutations rather than one mutation alone. The potential difficulty due to multiple suppressors can be easily resolved with whole-genome sequencing, as we have demonstrated by identifying in a single strain, two relA- suppressor mutations in the relA คล้ายคลึงกัน yjbM และ ywaC.

ใน ข. ซับทิลิส, the pre-existing paradigm for stringent control was that a single synthase/hydrolase of (p)ppGpp, the RelA protein, modulated the stringent response to nutritional stress [30]. Using whole-genome sequencing, we found that within one B. subtilis relA- strain, two suppressor mutations spontaneously arose, each mapping to a different homolog of relA and contributing to the partial recovery of growth. Multiple suppressors of relA- which are generated independently and spontaneously had mutations that mapped almost exclusively to ywaC และ yjbM. These two small homologs of RelA were independently identified using bioinformatics approaches in สเตรปโตคอคคัสกลายพันธุ์ และ ข. ซับทิลิส and possess only the synthesis, but not the hydrolysis and regulatory activities of RelA [10],[11]. Our results demonstrate strong genetic interactions among the three genes, and that RelA, rather than acting alone, acts in concert with these two other (p)ppGpp synthases ( Figure 7A ). การลบ relA abolishes the cells' ability to degrade (p)ppGpp, thus leading to poor growth likely because they produce too much (p)ppGpp rather than too little. This growth defect might subsequently trigger mutations in yjbM และ ywaC, which encode (p)ppGpp synthases. Finally, the strain evolves to eliminate (p)ppGpp synthesis activity, and is not as viable as a wild type strain that has all three genes, but nonetheless attains a strong growth advantage with respect to the relA- ความเครียด. Intriguingly, (p)ppGpp is virtually undetectable both in the relA-* suppressor strain and the relA- deletion strain (data not shown) [30], by thin layer chromatography (TLC), likely because relA- cells possess levels of (p)ppGpp that are below the limit of detection of TLC. In addition, within a population of relA- cells, individual cells that accidentally produce (p)ppGpp will not be able to degrade it and therefore will fail to grow and divide, resulting in a further diluted level of the nucleotide in a population. Our results do not rule out the possibility that RelA interacts directly with YjbM and/or YwaC to modulate their function and prevent any deleterious effects caused by their unregulated activity.

NS). Metabolism of (p)ppGpp in ข. ซับทิลิส. (p)ppGpp is synthesized by the enzymes YjbM, YwaC and RelA, but degraded only by RelA. NS). Metabolism of (p)ppGpp in อี. โคไล. (p)ppGpp is synthesized by the enzymes RelA and SpoT, but degraded only by SpoT.

A comparison can be made with อี. โคไล, where (p)ppGpp is synthesized by two proteins, RelA and SpoT ( Figure 7B ). RelA produces (p)ppGpp, and SpoT can both produce and hydrolyze (p)ppGpp. NS จุด- strain is not viable and can only be relieved by relA- mutations, while relA- alone is viable. ในทำนองเดียวกัน ใน ข. ซับทิลิส, relA- is relieved by yjbM- และ ywaC- การกลายพันธุ์ ข. ซับทิลิส แตกต่างจาก อี. โคไล in having two enzymes that purely synthesize (p)ppGpp ( Figure 7A ). Therefore, loss of function of either enzyme alone is not sufficient to relieve the effect of loss of RelA hydrolase activity. Our experiments support an emerging paradigm that Gram-positive bacteria utilize three enzymes for (p)ppGpp production and/or degradation, all of which perhaps play important roles in bacterial stress responses [10],[11].

The tripartite genetic network that controls (p)ppGpp levels determines the evolutionary landscape that leads to the generation of multiple suppressors. Conversely, the pathways that generate suppressors can reveal the evolutionary landscape of an organism and subsequently illuminate its cellular infrastructure [38],[39]. ส่วนใหญ่ของ relA- suppressor strains have mutations in yjbM หรือ ywaC, and almost all colonies eventually develop mutations in both genes. The occurrence of dual mutations is likely due to strong evolutionary pressure for increased fitness, and hence is a natural consequence of the tripartite regulation. The nature of this evolutionary landscape supports genetic interactions that involve three loci, instead of the more traditional module of two loci like จุด และ relA ใน อี. โคไล. Similar regulatory networks involving more than two gene loci are likely to be more common than previously believed and whole-genome sequencing is a powerful tool to uncover such systems.

Close examination of the molecular nature of the suppressive genomic changes indicates that there is no obligatory cascade of mutagenic events that is triggered by relA deletion ( Tables 4 , ​ ,5). 5 ). Diverse types of mutations arise, including insertions, deletions, and different types of point mutations (both transitions and transversions), which are likely mediated by different mechanisms. We did notice that mutations in ywaC seemed to involve a higher incidence of deletions, although larger sequencing-based sampling is required before a conclusion can be drawn. Alleviation of the relA- growth defect does not require concurrent mutations in yjbM และ ywaC, but can be achieved by sequential inactivation of these genes ( Figure 5B ). This result confirms the ability of bacteria to manipulate their genomes quickly to generate mutations that counter an unfavorable genetic change. The process of stress-induced mutagenesis is likely behind this plasticity [40]. Intriguingly, (p)ppGpp is strongly implicated in the mechanism of stress-induced mutagenesis and it is thought that genes whose transcription is up-regulated by (p)ppGpp are more susceptible to (p)ppGpp-induced mutagenesis [41],[42]. เป็น yjbM และ ywaC such genes and therefore specifically targeted for mutagenesis? What are the respective roles of YjbM, YwaC and RelA in sensing separate environmental stresses? These are intriguing questions that remain to be elucidated.


The POSSIBLE Gamma Squeeze (No we don't 'need' it, its POSSIBLE though)

I know you are tired of hearing claims about the ‘the next big squeeze’, but hear me out. BN-GO's stock price has literally gone >90% up from May 13th yet the short interest เพิ่มขึ้น by over 6M shares. กับ open interest of calls' outweighing the puts' open interest massively and หมดอายุ on June 18th, if the stock price keeps rising, we COULD see ATHs extremely fast.

I believe there is a ความเป็นไปได้ for a gamma and/or short squeeze if the stock can either hold where it is now or continue the move higher mostly because as you will soon learn, many shorts have an average price of <$7 and lower, และ margin calls are no doubt coming if this continues to run. Price target is at the very least all-time-highs but we could see >$30 easily (imo) if the word actually gets out on how auspicious of an opportunity this may be.

To my understanding there are a few main things that are needed for a gamma squeeze & reasons why this may happen -

Short dated expiration call options that far outweigh puts

"A gamma squeeze can happen when there’s widespread buying activity of short-dated call options for a particular stock. This can effectively create an upward spiral in which call buying triggers higher stock prices, which results in more call buying and even higher stock prices." - Source - This is exactly what we have seen the last few days yet the shorts seem to think they will be successful in pushing the price lower based on the dramatic increase of nearly 6M shares in the short interest count in less than two weeks WITH the price going nearly 2x in less than a month!

A high short interest only increases the proclivity for gamma squeezes to occur. In BN-GO's case, the short interest has only increased since May 13th when the share price was $4.41, now we are seeing an SI of the SO of around 15% or 41.5M shares according to Ortex data -

5. Open interest of call options compared to puts is absolutely overwhelming, along with the volume. This means that people are buying and holding way more calls than puts, betting on the stock price going higher before June 18th, ten days from typing this. Not only is this bullish short term but it fits an important requirement for a gamma squeeze - more calls than puts being bought.

Market Manipulation in BN-GO's Stock Price? -

Market manipulation is essentially proven (to the degree of proof goes with MM, not provable in a court of law, but nonetheless it has happened and is still happening imo) and here are some reasons why I believe market manipulation has and is occurring in BN-GO's price action -

Trajectory of price action since Feb. 16th is nearly identical (until this week) with the majority of high growth stocks. Yet the fundamental exponential increase in value that Bio-nano Genomics has experienced over the course of 4 months is not something that many stocks have. The SI increase and FTD increase along with naked shorting (imo) would explain this. Find me a stock that has increased in fundamental value as much as BN-GO has since February 16th with a similar chart. ขอให้โชคดี.

Here are the catalysts and fundamental value increases in the stock price that I can name of the top of my head that all are between February 16th and May 25th-

CEO and 3 C-suite members getting LEAPS with share exercisability valuing in the hundreds of millions WITH an exercise price of $7.83 which is NEAR the current and then stock price, announcement of 5 studies that in the company's own words would act as important marketing events that would likely lead to increased sales,

CFO projection of 'substantial double-digit revenue growth' along with his 20-40% YOY operating expense increase projection for the 'next few years' (According to own company estimates as far as sales and adoption profitability chances based on their numbers are likely to come at least one year before analysts are projection ((imo)),

MORE bullish insider transactions in the form of the CMO picking up more LEAPS after her original one mentioned above,

CEO and COO being awarded tens of millions of dollars in profit in the form of hundreds of thousands of shares 840k to be exact and as of now they have not sold any,

New EXTREMELY innovative product confirmation-nanonozzle (imo), added to MSCI index, confirmation of several large sales - Sequencing Coming to Bio-nano, United States Patent: 10995364

Several studies proving 100% concordance and increased accuracy of their main product compared to 'gold standard' of the market this company is trying to disrupt,

HUGE institutional ownership increase, from around 4-5% at lows up to 15.60% currently.

Announcement of five large clinical studies with the most important one (NIPT) coming out this year. These are likely to increase academic praise of Saphyr and increase sales in the aggregate.

Three (1 was extremely recent, so do not count it if you do not want to) China Saphyr adoptions totaling almost 1M in revenue.

Countless Saphyr adoptions and installations (see ER webcast replay)

Saphyr 2.0 prototype in Q4 2021 confirmation

Announcement of $450-$550 per genome to be reduced to $100 per genome by end of 2023 or sooner.

CEO Asked about TAM, “So in cytogenetics, broadly speaking, there's roughly 2,500 labs worldwide. Probably somewhere between 2 million samples per year being processed for this type of molecular pathology. And overall, that represents somewhere in the neighborhood of a $3 billion to $3.5 billion market for us. That includes some of the research market as well. But it's something that I would really emphasize for these investors who are asking questions is that that's the market that is right in front of us today. And with the technology accelerating capabilities as quickly as it is, being used in research to discover new applications, the total market opportunity for optical genome mapping goes well beyond that low single-digit billion number, and it's substantially larger. It's harder for us to quantify it specifically because some of the applications haven't even been developed, others are still on the come.” - Erik ------- THIS MEANS THAT the CEO thinks the TAM of BN-GO is 'substantially larger' than the current 3-3.5B estimate BECAUSE there are applications of optical genome mapping that 'have not even been developed'.

There are a myriad more listed in this document, ctrl f for best results or see 'Market Manipulation' section.

Why BN-GO is Fundamentally Undervalued-

A higher life expectancy for everyone in the aggregate along with a better quality of life is what would happen should their goal of 'global Saphyr adoption be effectuated. ɼhemotherapeutic drug enhancements' is one of many of the revolutions that we could see specifically because of what this company does. Paraphrasing the CEO, 'we believe that the next big wave of innovation in Biology will derive from optical genome mapping', which is what BN-GO's Saphyr does-optical genome mapping, and they do it better than anyone. According to the company itself, >500bp detection in SVs with Saphyr compared to the CMA, FISH, and KT competition is cost effective, requires less hands on time, and has a faster turnaround time. Not to mention it has more accurate readings and has less false positives. LOH and SNV detection are said to be in the works, currently zero of the three competing methods can detect these. Nor can FISH, CMA, or KT detect the wide range of variant classes Saphyr can.

With this knowledge, one wonders why Saphyr has not already been adopted in all 2,500 cytogenetic labs, most of this can be attributed to resistance of change and relatively low academic praise and exposure of Saphyr's capabilities, but with FIVE large clinical studies in the works on NIPT, postnatal screening, hematological malignancies in leukemia and lymphomas, and solid tumor research, that is sure to change all in due time. Not to mention cost per genome reducing from $450-$550 currently to $100 by at maximum 2023 (Saphyr is already cost effective, just imagine how cheap it will be compared to other methods once the price more than halves per genome). Throughput to increase by 14x from the already immense maximum of 5000 genomes per year with the current Saphyr system. Throw in in the nanonozzle release that 'may' include SNV detection and will ɿill in the gaps of what current NGS is missing', and one has a strong case to make that this company will revolutionize healthcare and the entire genomic sector as we know it.

My Plan & Position For Transparency Reasons -

My goal is 10k shares in total by the end of summer. I will certainly have 10k BN-GO shares by EOY. I will hodl and add for years as this is not only auspicious short term but potentially even more lucrative for long term investors (imo).

I will be adding shares this month and would not be surprised if I have >2k shares soon.

TLDR: BN-GO has a high chance (imo) of gamma squeezing and short squeezing all the way to ATHs and beyond. Add in the fact that we are fundamentally undervalued and have definitely been manipulated for months and are finally starting to see the tables turn and you have a case that this is long term hodl.

TLDR for the TLDR: BN-GO go moon this week, invest soon or fomo in at >$10, then >ATHs


ดูวิดีโอ: งานวจยดานจโนม (มิถุนายน 2022).