[科學][生命][討論]DNA的解碼?
來源:http://forum.gamer.com.tw/C.php?bsn=60433&snA=28393&subbsn=0&page=1
 
 

earthlovemoo(台中阿任)


大家好
小弟不才

很久以前有聽過人類積極在於DNA的解碼
但是好像後來都沒有什麼消息了
在之前又有聽過一則新聞提到
人類有把一種小蟲子的DNA全部解碼
這樣是代表
人類可以完全了解DNA的功能嗎?
我覺得DNA真的是個很神奇的東西
有點類似[電腦檔案]
但是我完全忘記DNA的訊息儲存方式了

我有幾個問題
感謝大大的分享!
1.DNA的解碼是否可以讓人類控制生命的型態?
例如: 知道 AABBCC 的組合 = 耳朵?
CCFFCC 的組合 = 眼睛?

2.DNA的條數影響?
例如人類有 46條 = 比較高等?

3.人與人之間的DNA差異在於?
例如:
AAACCCDDD = 人類(大明)
AAACCCDDE = 人類(小明)
就是說...哪邊是決定是人? 哪邊決定人的差異?

感謝大家分享與心得
感恩!!




rwer:我要超能力~

大一統理論:1.已經解碼完成

大一統理論:2.不能完全了解DNA的功能 只是解碼完成而以

大一統理論:3.還不能完全理解其功能和多重作用 控制能力因此有限

UnBreakMyFart:我對dna有興趣就像一樓說的, 超能力

Rubik/惠特利DNA比較多沒有比較高等喔(唐氏症就是多一條DNA,猩猩有48條,然後其實有更多物種DNA數量更多)

Tom:DNA的條術(X) 染色體的數目(O)

Tom:條數

懵懂無知的初心者:好奇問一下 解碼跟定序會當同義詞用嗎

光山 kohinoor:不會

光山 kohinoor:定序的意思是把DNA的文本定出來 實際上裡面的東西有什麼意思還不清楚

光山 kohinoor:定序之後 能馬上作的應用有:判斷親緣關係、標定基因位置

光山 kohinoor:如果想要進一步修改基因 就還得知道那段DNA的意含 或者是知道基因的序列

光山 kohinoor:比方說 你知道血友病基因會引發血友病 但是還不知道血友病基因對應的是哪一段序列 這種問題定序之後還無法回答

愛落紅塵:曲曲人纇 想探討萬命本質? 乖乖核戰吧

zzqqoopp6:更正一下 所謂的血友病並不是血友病基因(至少我沒聽過)

zzqqoopp6:它純粹是第8或第9凝血因子缺乏 當然缺乏的原因有很多 不單單是基因的問題 血友病有分A型(缺8)跟B型(缺9)

光山 kohinoor:我想表達的意思是性狀和基因不一定對應的起來

懵懂無知的初心者:因為我看樓下有人說人類基因組計畫就是解碼出來 不是吧

懵懂無知的初心者:感謝你

光山 kohinoor:人類基因組計畫只是知道全文 不代表董他的意思

垂暮龍-青月:只能知道相應關係 還得了解上下文....就像寫程式直接繼承別人的東西過來 也不會戰鬥力暴增一樣

spina258(KeTeer)

直接回答吧
1如果是完全了解應該可以。
 
2很多動物比人類還多,植物個體不同倍數就不同的也一堆。

3現在分類法是那個界門綱目科屬種,不是看小部分DNA差異。如果你是要問小部分差異,那就只是影響個體性狀。

 

abc003(大一統理論)

※ 引述《earthlovemoo (台中阿任)》之銘言
> 在新視窗開啟圖片
> 大家好
> 小弟不才
> 很久以前有聽過人類積極在於DNA的解碼
> 但是好像後來都沒有什麼消息了
> 在之前又有聽過一則新聞提到
> 人類有把一種小蟲子的DNA全部解碼

人類基因組計劃


1.人類基因圖譜已經解碼完成,在2005年代時就已經解碼完成人類基因圖譜
人類基因編碼只有4個字母 就是A、T、C、G,分別是腺嘌呤、胸腺嘧啶、胞嘧啶、鳥嘌呤

2.但雖然是解碼完成,但卻不能完全瞭解DNA的多重功能
只是單存解碼完成而以並不瞭解編碼的意義,比如說有些DNA同時是這樣又是那樣的多重功能
例如藍色眼睛的DNA和雀斑是共用一個基因

3.還不能完全理解其功能和多重作用 控制能力因此是有限的



Woody:第一條的排列有誤:A、T、C、G,分別是腺嘌呤、胸腺嘧啶、胞嘧啶、鳥嘌呤

Cynicism:為什麼會命名成這種難懂的文字...還是翻譯問題??

挖嘎:翻譯問題 我超討厭用中文字的

kenny6a34(懶人)

就像某樓所說的,人類的DNA圖譜在很多年前已經順列出來

但是,(1)目前科學家已確定影響外表的DNA,只是佔少數百分比,實際數字不清楚。
而其他DNA的功用也有待探究,其他已知功能也相對應用在基因改造食物,及疾病(癌症)治療等等。
 
但是也有例子,即使雙胞胎的DNA完全相同,也會出現某些地方的不一樣,例如以下影片︰
 
 
基因所操控的,遠遠不指外觀上的表現,但是我也不清楚究竟控制的是甚麼?

(2)正如大家提及,不同物種的基因數目也不一樣,而沒記錯的話,分類是按身體外觀特徵的。

網路小兵:搞不好只是人類認知裡的DNA一樣而已,說不定有比DNA更微小的東西人類尚未發現,而那更微小的東西不一樣所以才導致雙胞胎的某些特徵不一樣

光山 kohinoor:你說的東西已經發現了 叫作外遺傳標記

光山 kohinoor:外遺傳標記會遺傳、但是不會顯示在DNA上面

大一統理論:工蟻和蟻后DNA完全一樣發育成不同的型態是不是外遺傳標記?

挖嘎:樓上是在說homolog嗎?其實只是因為有沒有定序手段的差別而已 以前人沒辦法定DNA序列出來看不出基因上面的差異

挖嘎:所以在做生物分類的時候只好用外觀(有沒有長翅膀? 是不是直立?)等等 用基因體來"更新"這種分類資訊是一個很大的研究領域

光山 kohinoor:之前有個研究 確定蟻后和工蟻之間有外遺傳差異 蟻后的嗅覺基因被外遺傳關掉了

光山 kohinoor:但是外遺傳是否違造成差異的主要原因我不知道

光山 kohinoorhttp://www.sciscape.org/print_news.php?news_id=2534

光山 kohinoor:獅虎會長的超級大也是因為外遺傳

挖嘎: 你在說的那個是 小動物吃掉一些微生物寄生蟲 比如說某種蠑螈會吃海藻獲得可以行光合作用的能力

挖嘎:那種基因交換跟高等生物差別很大 而且跟DNA的總量也"無關"

光山 kohinoor:蠑螈吃海藻??? 我笑了WWW

光山 kohinoor:是海蛞蝓吃海藻,蠑螈是兩生類 青蛙那類的東西 一碰到海水就會脫水掛掉怎麼吃海藻WW

光山 kohinoor:相同的基因 拿到越多份 總表現量就會越強

光山 kohinoor:你先去看一下植物的多倍體現像再來反駁我好咩 染色體多出好幾套在植物身上是非常常見的

光山 kohinoor:多倍體的植物通常也會長得更大一點

挖嘎:好吧 不小心打錯了 海蛞蝓 總之你加油

挖嘎:copy數跟expression量不成正比說 就算重複序列很多 也不一定表現量(如果這是你所謂的"強度"的話)比較多

光山 kohinoor:唾液澱粉脢阿

光山 kohinoor:人類和黑猩猩COPY數不同 表現量也不同

光山 kohinoor:重複序列和多倍體都會讓最後的表現量增加 搞不懂你質疑的點是哪個

挖嘎:因為你說的是錯誤概念啊? 不過沒差啦

zx09182001(犬犬)

小小的醫事檢驗科專四生的不專業解答
1.DNA的解碼是否可以讓人類控制生命的型態?
例如: 知道 AABBCC 的組合 = 耳朵?
CCFFCC 的組合 = 眼睛?
可以 只是大型的動物實驗容易失敗或是根本被禁止的
如果用小一點的細菌 我們可以利用病毒插入我們想要製造的物質的基因 像是胰島素 當然如果我們插入其他功能的基因就可以產生想要的性狀 如細菌莢膜 可抵抗人類免疫細胞吞噬

2.DNA的條數影響?
例如人類有 46條 = 比較高等?
數量和高等沒有絕對的關係
有關係的在於基因的功能
如果一堆偽基因或是無意義的鹼基排在長也沒用

3.人與人之間的DNA差異在於?
我和你的基因只差0.1%
也就是我們基因有99.9%是相同的
但23對染色體 共有六十億個鹼基
只要關鍵的鹼基一個和正常的不一樣形成終止碼的基因轉錄不出來要用的物質
就有可能會死亡 例如嚴重地中海貧血
血紅素無法攜帶氧氣 或 異常 缺乏等
可能在未出生就死於腹中
基因主要在於關鍵地方不是量 是序列
 
 

路人甲:我想問生物有大量的垃圾基因是不是真的?

山頂洞人:沒有實驗,沒有答案,套一句QB的話:能夠被觀測就表示能夠被干涉,能夠被干涉就能夠被支配

山頂洞人:不過...想要這樣做也要解決技術問題就是了

犬犬:不一定是垃圾基因 也有可能是人類還不知道它的功能 不一定要表現出來才有意義 有些就算不表現 也決定了讓其他基因表現或不表現的能力

楓幻之夜:有些基因平時不表現,等到某段基因產生錯誤時,會使它啟動產生修復蛋白質去修正錯誤基因

犬犬:對 每個細胞每天會有一萬個左右嘌呤鹼基流失 如果沒轉譯出修補的蛋白 就有可能形成癌症

fnf2000(美國短毛貓)

什麼時候才有超級調整者阿

有更強的頭腦,更發達的肌肉

接下來就是血腥情人節了(X

zzqqoopp6(朕就是這樣漢子)

1.DNA的解碼是否可以讓人類控制生命的型態?
A:可以,有個諾貝爾獎得主讓蒼蠅的腳長到頭上,但是他還是蒼蠅,我們能讓他的個體表現出不一樣的特徵,但是沒辦法做物種間的轉換
你可以去查看看現在實驗動物,幾乎都是因為特殊需求做出來的 例如:null-mice

2.DNA的條數影響?
A:不影響。你看到的46條染色體真的有功能的其實根本不到幾%
詳情可以去查exon跟intron的差別
這邊指的沒功能並不是無法轉譯出蛋白,而是功能未知
中心教條(central dogma)在現在雖然還是中心思想,但是卻不是唯一答案
現在我們所知道的是有一些DNA轉錄成RNA在splicing成mRNA的過程中並不是所有的mRNA都會產生蛋白
最有名的就是microRNA中的miR-15a跟miR16-1 ( CLL )
*microRNA 是直接由RNA上切下來的,這一段不會有蛋白質產品,但是物理特性又跟RNA天差地遠,抗酸、抗鹼、抗反覆冷凍回溫、抗RNase、可長期保存,相當可 靠,個人認為這是未來分生實驗室的主流。前幾年有篇paper證實microRNA可以應由食物進入到人體,所以......基改團體如果有唸書估計又可 以大書特書了


3.人與人之間的DNA差異在於?
A:幾乎沒有差異,差就差在不同的個體間在某些片段表現的地方不一樣
敝人我曾經在某HLA實驗室工作過,基因的有一些地方在個體之間的差異不大 例如:HLA-DP
但是又有一些地方是不同個體之間有些微差異的 例如:HLA class 1的exon2跟exon3
問題是有差異的DNA不代表不能做出不一樣的蛋白,有的時候明明序列不一樣,但是做出來的產物確實一樣的
 
 
關於樓主說的"DNA的功能" 其實是很抽象的概念
因為DNA的功能不只在於保存遺傳訊息,我上面有提到有exon跟intron的差別
exon就是會在splicing中被留下來的部分,intron會被切掉
我們DNA中intron佔了大多數,意味著我們多數的DNA序列現階段的功能是不知道的
後來科學家有找到所謂的siRNA或是microRNA,是負責基因調控的部分
說到基因調控我們可以很自然聯想到 RAS、RAF、EGFR、HER2這類的東西
 
所以關於DNA的功能,現階段除了這幾項之外,其他的部份對於人類而言真的是未知數

光山 kohinoor:條數還是有影響的啦 越多條 細胞分裂需要的時間就越多

zzqqoopp6:這就不一定了

光山 kohinoor:是不一定 但是有這個大趨勢

挖嘎: noncoding RNA 只能算是The C-Value Paradox的其中一種可能原因? miRNA只是其中一個例子,特別提它好像有點偏離主題了?

光山 kohinoor:哪會 miRNA在基陰的互相調控間扮演了很重要的腳色

挖嘎:我只說是他是一部分主題 跟原本PO的人問的題目有差 我問你晚餐吃啥 你會回答說義大利廚師用的餐具跟日本廚師不一樣嗎?

挖嘎:回答的資訊沒錯 但是跟問題相關性很低?

Jeko:雖然看不懂,但感覺很厲害

tcss0612(克羅芬絲狂信徒-光山)

※ 引述《zzqqoopp6 (朕就是這樣漢子)》之銘言

> 2.DNA的條數影響?
> A:不影響。你看到的46條染色體真的有功能的其實根本不到幾%
> 詳情可以去查exon跟intron的差別
> 這邊指的沒功能並不是無法轉譯出蛋白,而是功能未知
> 中心教條(central dogma)在現在雖然還是中心思想,但是卻不是唯一答案
> 現在我們所知道的是有一些DNA轉錄成RNA在splicing成mRNA的過程中並不是所有的mRNA都會產生蛋白
> 最有名的就是microRNA中的miR-15a跟miR16-1 ( CLL )
> *microRNA是直接由RNA上切下來的,這一段不會有蛋白質產品,但是物理特性又跟RNA天差地遠,抗酸、抗鹼、抗反覆冷凍回溫、抗RNase、可 長期保存,相當可靠,個人認為這是未來分生實驗室的主流。前幾年有篇paper證實microRNA可以應由食物進入到人體,所以......基改團體如 果有唸書估計又可以大書特書了

補充一下,染色體的條數還是會有影響的
1.會影響細胞生長的速度
2.會影響交配可能
3.會影響基因的強度
 
 
1.會影響細胞生長的速度
染色體越多條,就需要更多準備工作才能複製完成。
有一種蕨類含有1260條染色體,他在細胞分裂時需要1天以上才能分裂完全。
 
 
2.會影響交配可能
染色體數目不一樣的兩種生物就無法產下有生殖力的後代。
馬跟驢子在基因上的相似度很高,但是騾就不能繁殖,主要原因就是染色體數目不同,不成對。
 
獅子和老虎都是38對,所以他們產下的後代(獅虎Liger)是有一點點生殖能力的,Liger可以跟虎or獅交配。
 
植物就更神奇了,植物可以靠把染色體加倍來避開不成對問題。
染色體數目不同的兩種植物交配後產生後代,這後代再把染色體加倍,就能作出有完整生直立的雜交種。這在自然界(台北秋海棠)和人為育種(黑小麥)都有出現過
 
 
3.會影響基因強度
相同的基因,重複越多次,表現量就越強。
 
像是唾液澱粉脢,黑猩猩只含2個副本,人類則含有4~8個副本,所以人類消化澱粉的能力比黑猩猩強,當然不是直接強2~4倍,基因很複雜的,很少遵守這種簡單的線性增加。
但的確是越多個相同的基因就越強。
 
所以如果有變種人含有92條染色體,那他的各種能力應該都會比普通人類強一點點。
不過不知道為什麼,脊椎動物都沒有多倍體現像,植物和昆蟲比較常見。
 
 

櫻庭十六夜:話說,染色體越多條,就需要更多準備工作才能複製完成,所以如果是哺乳類動物,染色體越多條會導致懷孕期變長嗎?

†Osz:能影響懷孕期的因素太多了,像是有袋類就能證明這兩者之間沒有絕對的關聯吧

光山 kohinoor:這個關聯並不是非常嚴謹的 影響因素太多了 只是知道有這趨勢而已

櫻庭十六夜:原來如此,感謝說明。

世界的記憶:如果懷孕週期跟染色體數量有關那老子不就是神了嗎?

心賴散人l菇寶l:那個蕨類是叫甚麼

光山 kohinoor:你用1260染色體和蕨類這兩個關鍵字去GOOGLE就能找到了 這種基本的資料蒐尋能力要有喔

光山 kohinoor草履蟲染色體最多 可以高達1萬多條 但是草履蟲的染色體運作原理和其他生物差很多.....

zzqqoopp6:感謝補充

zzqqoopp6:非醫用的部分我實在是不熟

挖嘎:那唐氏症患者先天染色體多一段不就比較強? 癌症細胞不就可以當成強化藥? 這資訊不太正確捏

光山 kohinoor:這是事實 你去GOOGLE 多倍體植物 染色體比較多的確會略為增強某些能力

光山 kohinoor:我沒說一定會

挖嘎:上一串回答了 那篇科普的新聞跟原本的論文我都有看 大略了解你誤解的地方在哪裡 也在上一串說過了

光山 kohinoor:染色體條數和DNA條數的差別吧

挖嘎:染色體 = DNA纏繞在histon上面的一團東西 這是國高中生物吧?

海狼級潛艦:應該說表現量增加不一定會是產生正向的影響?

オニタク:我好奇植物嫁接的原理 他們都不會排斥嗎?

光山 kohinoor:植物沒有個體免疫系統,植物的免疫系統辨識的精細度,只到物種,不到個體。

光山 kohinoor:植物是分不出相同物種不同個體之間的差異的,所以植物不會有器官移植排斥(嫁接)

光山 kohinoor:順帶一題 只有哺乳類的免疫系統演化出異體排斥,辨識精細度到個體的免疫系統。

光山 kohinoor:植物的免疫系統採用黑名單系統:在這個名單上的就攻擊 哺乳類則是白名單系統:不在這名單上的就攻擊

光山 kohinoor:這個差異使哺乳類的免疫系統會攻擊的對象異常的多 = =

海狼級潛艦:無法理解何種天擇壓力能導致物種間排斥演化到個體間排斥......

lord84571557(L.O.R.D)

說到miRNA會影響基因,順便貼一下這篇有趣的文章,造成很大的衝擊
miRNA的影響其實讀生醫或醫學都會知道
但能實驗吃的米/植物可以直接影響動物細胞基因的post-transcriptional modification倒是很少見
http://www.ncbi.nlm.nih.gov/pubmed/21931358

但老實說當時支持或反對方都是罵翻天的,從理論到實驗方式都有爭論
所以基改團體真的能不能利用這個資訊個人還是保持觀看態度
 
可惜的是我後來就沒有再追這方面研究了,近年來有變化嗎?

朕就是這樣漢子:反基改本來就是靠意識在說服信徒的 因為他們提不出任何有關基改是有害的證明 所以我才會打那段話 對不對不重要 重要的是能不能夠獲取人心

Ha47:要能用數據說服人機改食品無害

朕就是這樣漢子:已無害的角度 美國就是一個超大數據庫了

挖嘎:你說的那篇2012年nature的論文是說 植物的miRNA可以透過口服進到人體內 大陸人做的

挖嘎:好像跟問題不太相關?

mamonster(挖嘎)

※ 引述《earthlovemoo (台中阿任)》之銘言
> 在新視窗開啟圖片
> 大家好
> 小弟不才
> 很久以前有聽過人類積極在於DNA的解碼
> 但是好像後來都沒有什麼消息了
> 在之前又有聽過一則新聞提到
> 人類有把一種小蟲子的DNA全部解碼
> 這樣是代表
> 人類可以完全了解DNA的功能嗎?
> 我覺得DNA真的是個很神奇的東西
> 有點類似[電腦檔案]
> 但是我完全忘記DNA的訊息儲存方式了
> 我有幾個問題
> 感謝大大的分享!
加減在這行當裡面今年出了一兩篇論文 準備要拿博士了
於是順手回答一下
大部分資訊網路都查得到,就算是專門研究這東西的人偶爾可能也會出錯
畢竟這種東西是每年都會更新的 但是大略上應該不會有問題
 
就稍微回答一下吧XD
 
順便盡量縮減一些專業術語的用量

> 1.DNA的解碼是否可以讓人類控制生命的型態?
> 例如: 知道 AABBCC 的組合 = 耳朵?
> CCFFCC 的組合 = 眼睛?
 
所 謂中文翻"解碼"這個詞 其實是Sequencing. 在兩千年的時候,跨國合作成功定序出人類的基因體序列, 簡單的說,就是把細胞核裡面的序列抄寫出來,所有的生物的DNA都是ATCG四種核甘酸的排列組合出來的,定序這個動作就是把這些 AAAAGTAG.....給記錄下來,拿人類來說就是把這一長串有三十億個字母這麼長的"密碼"字串給抄寫出來 ,離一般人想像中的"解碼",有很大一大段的距離
 
這個定序的步驟當年花了1億元美金左右才有辦法定序一個人的DNA ,到現在的次世代定序已經可以花大約一千元美金就可以定序出來了
 
回答你的舉例,這種動作叫做annotation,在這一長串的字母裡面找一些小段,去靠一些實驗來
去看看它有沒有被做那種蛋白質......或者從演化上面推斷它的原理
 
要去人工調控單一細胞的基因體,讓一些細胞株或細菌幫你做一些蛋白質.
 
或者是在胚胎階段去讓老鼠大小的動物的一些基因表現出來的時候會發光,或者是喪失功能等等目前都辦得到
 
但是那些目前都只是用來探究基因的功能是什麼的方法而已,跟問題中的假設有很大一段距離
 
> 2.DNA的條數影響?
> 例如人類有 46條 = 比較高等?
 
這是一個歷史悠久的生物常識問題,好像有某種植物的基因體是人類的好幾倍大的樣子(也就是DNA的核甘酸數量多十倍) ,或者是一些相近的魚類,外表相近但是DNA就是多好幾條, 基本沒甚麼影響
 
十年前的人會認為說 按照DNA-> RNA->蛋白質的這條線下去,越多有被做成蛋白質的基因的生物或許越複雜,越高等,但實際上例外很多
 
實際上有很多序列做成的小分子和其它東西的交互作用都還是未解的問題
 
是目前主要的研究領域
 
大部分人對這個問題的答案,幾乎都是生物的複雜度跟染色體有幾條 或者有多大條沒有直接關聯性,狀況證據也很多
 
但是細節的理由還在研究中
 
 
 
 
> 3.人與人之間的DNA差異在於?
> 例如:
> AAACCCDDD = 人類(大明)
> AAACCCDDE = 人類(小明)
> 就是說...哪邊是決定是人? 哪邊決定人的差異?
> 感謝大家分享與心得
> 感恩!!

Polymorphism.......雖然很想靠一個字回答這個, 但是簡單的說大部分健康的同性別人類的DNA序列都幾乎一樣(99%以上!), 很多時候多樣性都只是一個位子上面的小差別
 
比如說某條基因的AATG,在某些遺傳病裡面是AAAG,
 
從你身上定序出來的基因體,可以幾乎百分之百對到reference(某個被定序出來記錄起來的外國人的DNA序列)上面
 
這些細小的變異,就是很多人在忙著研究或想拿來賺錢的基因檢測在檢查的東西
 
比如說安潔莉娜瓊麗就是某條基因遺傳上面有變異,會在中年過後將近百分之百會得乳癌
才把乳房動手術先切掉的.....
 
另外某些免疫細胞會有隨機產生多樣性序列的機制,
 
但"大略"來說,假設我跟你都是男的,我手上的一顆細胞裡面的DNA,和你手上一顆細胞裡面的DNA會幾乎一模一樣
 
 
以上
 
 
真的略過很多細節,感覺上是高中程度左右的生物常識
 
但是還是會有出錯的機會XD 有發現也把資訊來源寄給我捏
 

zzqqoopp6:分生真的是很有趣的一門學問呢

挖嘎:台灣現在念這個好像除了做研究以外沒甚麼出路? 中裕新藥或者是那些臍帶血公司缺的都是sales,都不是研發的感覺

光山 kohinoor:樓主沒搞清楚DNA條數、DNA總量、染色體數量的差異吧

光山 kohinoor:我說的是多倍體,相同的染色體越多條,就會表現的越強。

挖嘎:你在說的是重複序列 總之你辛苦了

光山 kohinoor:我不覺得這討論有任何意義== 既然你是研究生那你應該知道我說的是什麼。 我要表達得很簡單 多倍體生物的基因表現量會比較強 所以染色體條數是會有影響的

挖嘎:恩恩 表現量強度跟序列重複幾次沒有直接關聯性

挖嘎: 你的手上的細胞和你的肝細胞的DNA序列是一樣的 但是表現出來的基因卻不一樣 所以才會長不一樣 只是在跟你解釋這個概念 謝謝

挖嘎:我相信你本來看來得不知道是書還是網頁上面的本來作者想表達的意思跟你的誤解不太一樣 不過本來就是沒甚麼好討論的東西 你加油吧

海狼級潛艦:三類除了醫牙都呵呵啊 藥學也是 平時上課跟我們說出路多元說得很好聽 實際上要研發一款新藥平均要25億鎂將來還會越來越貴

海狼級潛艦:藥廠跟研究機構都不怎收人的情況下一個藥師是能研發個鬼

挖嘎:製藥需要10年 但是大藥廠還是會顧人 基因檢測或者是定序技術 軟硬體其實都需要研發

海狼級潛艦:現在台灣藥廠幾乎都只要sales啊

海狼級潛艦:藥物探索期一到二年,臨床前試驗二到四年,人體臨床試驗四到五年,最後還要經過一到二年的NDA審核

挖嘎:還要上百億的研發經費跟兩千人左右的砲灰 台灣沒有公司有這種成本

挖嘎:大部分都是二三期開始接 或者還在第二期

海狼級潛艦:健保藥價硬砍跟檢驗標準提高兩面夾殺也讓很多藥廠活得很辛苦

挖嘎:本來就都做些學名藥利潤不高也沒在外銷吧?

挖嘎:有幾間有在國外設廠賣就是了

海狼級潛艦:是阿 所以醫牙以外的三類科系在台灣都沒前途啊 我現在就在準備拚轉系考

有限狀態自動機:人類基因定序貴是貴在你還要做de novo assembly

有限狀態自動機:這跟一般情況NGS定序便宜其實有很大差異,你拿人家定好的reference然後拿你的sample去做分析不論在計算上還是實驗複雜度上成本都差很多

有限狀態自動機:一般NGS分析可能30x深度夠你用了,NGS要搞denovo assembly我猜100x都不見得組得出什麼毛

挖嘎:De Novo assembly 就一種演算法而已 感覺這說法有點一知半解?

挖嘎:因為已經有之前用第一代定序做過的reference 所以人類或老鼠的基因體基本沒人在用de novo assembly

有限狀態自動機:另外,定序-sequencing 解碼-decoding 一般人會錯,專業不能錯,decoding有可能是在講其他行為

挖嘎:為什麼以前的定序會貴的原因是因為耗材和時間 沒辦法像次世代(第二世代定序)一樣平行處理 但是次世代因為訂出來的片段太短

挖嘎:很少有人用"decoding"這個字 除了英翻中之後再返翻中的人以外 說了你認知中的那個動詞叫"annotation"

挖嘎:連科普的記者都幾乎不用了

有限狀態自動機:台灣藥廠的問題是做很多RD,但是不做臨床,通常都是藥物設計出來了然後賣給國外做臨床

有限狀態自動機:你一代組玩,難道後面還用一代組,assembly不會更新?

挖嘎:臨床台大好像有在做?(去年選舉的新聞 中裕就是自己做的吧 何大一萬歲 邱X 蔡正X吃大便

挖嘎:你是真的不懂assembly還是認知有誤差? reference assembly本來可信度就比De Novo 高 這是常識喔?

有限狀態自動機:而且assembly 如果你可以定長定準,你幹嘛要訂多呢? 這跟平不平行無關。

挖嘎:model organism之所以可以組得比較完整就是因為有用一代組過,可以去UCSC genome browser 看看河豚之類的是不是都組得比較不完整

有限狀態自動機:對,用一代組的原因是什麼 ? 所以這跟平不平行無關,當然也不是你可以拿現代NGS去比的東西,定長的原因就是因為要做denovo assembly

挖嘎:恩恩 我們在雞同鴨養 你覺得你了解定序 我覺得你認知有問題 跟你解釋好像也不太通,

挖嘎:自己看吧 https://era7bioinformatics.com/en/page.cfm?id=1500 大部分的知識都是google得到的

有限狀態自動機:你有空去研究一下denovo assembly你就知道我在說啥了,NGS那麼便宜為什麼不能用NGS組? 你說不過是個演算法,我告訴你問題就是在演算法

挖嘎:請問你真的做過assembly這個動作 或者是處理過定序的資料嗎? 錯誤的觀念通常都是來自於翻譯錯誤的第二手資料

挖嘎:不好意思我剛好就是在做這個東西 最近也發表了一篇鰻魚的基因體的assembly scaffolding相關的文章在國際期刊上面 明年初會去舊金山演講

有限狀態自動機:assembly這個動作是在電腦裡面完成的(我希望你知道),我還設計過這東西的演算法,

挖嘎:請把連結裡面的資訊看清楚之後 再來說這個問題 謝謝

有限狀態自動機:如果短序列可以做assembly那你sanger也不用做長,成本一樣可以降低

挖嘎:所以 NGS的成本從10億縮短成一千塊錢了啊?

挖嘎:你是看到了五年前的書嗎?

有限狀態自動機:那你做過,我問你你要怎麼處理幾千甚至幾萬個base 的 repeat?

挖嘎:所以它是演算法啊?

有限狀態自動機:不是,真的是雞同鴨講,你不知道我在攻擊你哪一點,我是說,你不能把NGS定序跟以前人家在做整條序列assembly混唯一談

有限狀態自動機:就是你第一題的第二段

挖嘎:參與設計過 De novo assembly的演算法 可是卻連基本概念都弄不清楚嗎? 這樣的工具發表不出去呦

有限狀態自動機:人家NGS是開心定量簡單做alignment然後跑跑分析了事,assembly受限於演算法不能處理短序列重複問題,所以必然需要實驗提供長序列

有限狀態自動機:這才是你用一代定序做assembly的原因不是嗎? 不然誰家神軟體可以幫你解repeat你還何必定長呢?

挖嘎:"人類定序會貴是因為de novo assembly" 這句話就滿怪的 不覺得嗎? 我就只對你這句有問題

有限狀態自動機:所以整段 告訴你把核心搞錯了,你把實驗當作核心,問題壓根不是在實驗,是在分析。

挖嘎:太貴了 所以現在已經沒人在用第一代了阿? 你說得沒錯因為 repeat的關係所以"其他物種"組不起來 但是人類和老鼠等已經有Reference了啊?

有限狀態自動機:完全沒問題好嗎? 我就說了,當年如果可以解短序列重複問題,那他和必定長呢?他也跟你定短短的這樣會花到幾億?

挖嘎:reference會組比較完整是因為一堆人有用FISH或者是其他技術在改進他的scaffolding 這還是進行中的研究吧?

有限狀態自動機:你有空打開aligner隨便輸入一個序列,大概15個字以上就很難找到multi-alignment了,那你為什麼定序要一條訂到幾千個base

挖嘎:很難相信真的有人可以這樣觀念錯誤就做出一套演算法可以用的 還有再說一次 assembly是演算法

挖嘎:"你有空打開aligner隨便輸入一個序列,大概15個字以上就很難找到multi-alignment了"問出這個問題的人似乎連NGS的原理都不太懂得感覺

有限狀態自動機:關鍵是後面那一句,你圈錯了

挖嘎:不過我基本願意相信你自稱的所有經歷,有空可以私信給我,我們來仔細聊聊研究相關的問題無訪, 或者願意拜訪我們實驗室也可

挖嘎:當然如果方便的話約時間由我過去貴單位拜訪也可

挖嘎:在這邊討論沒有很大的意義 我覺得我已經把一樓的問題回答得很淺顯易懂了

挖嘎:幾千個base? 挖 原來你是未來人 在做assemble 第三代定序的read的演算法 小弟有眼不識泰山阿(笑

挖嘎:第二定序的一條read就一百到兩百而已 這不是De Novo assembler開發者會不清楚的資訊吧? 你眼界真的太高了 算我輸了(偷笑

挖嘎:第二代定序

有限狀態自動機:我說幾千是指一代定序,第一代訂量很少但是可以定長,第三代奈米孔洞不是定幾千是定幾萬

有限狀態自動機:如果你真的懂assembly你一定知道為什麼我要叫你用aligner去試這件事,

有限狀態自動機:因為assembler就是他媽aligner下去做的,而我叫你做的這件事就是最關鍵的確認你拼接點的uniqueness

挖嘎:阿所以跟 De Novo的 assembly有甚麼相關?

挖嘎:請問大哥在他媽的align下去的時候是用甚麼東西去align甚麼東西XD?

有限狀態自動機:15個base就完全不重複了,代表只要你實驗可以定到整條序列的任何位置,我就可以把它拼起來,而你每條reads只要保證重複段有15的base就夠了

有限狀態自動機:這樣的話,了不起深度兩倍吧,你怎麼會花那麼貴的成本在做實驗呢?

有限狀態自動機:reads align reads

有限狀態自動機:reads 跟 reads align 找到重疊序列於是你reads就變長了,我們只要重複這個process序列就組出來了你不知道嗎? 我以為小學生就會拼拼圖說

有限狀態自動機:太可怕了,我完全不敢想像貴實驗室要帶你出去,我靠,我家卡經費老師要帶我還帶不了

有限狀態自動機:我好擔心再這樣下去我要從頭教你做assembly

挖嘎:深度兩倍?XDD 我們是在做Genome assembly 沒錯吧?XD

挖嘎:挖 你也知道是在拼拼圖耶 好棒喔 太厲害了加油

有限狀態自動機:該不會你家assembly就是實驗做出來跑跑crossbow這樣就叫"I know assembly"

挖嘎:恩恩 太辛苦了 真的 可以把大大的神作assembler貼出來讓小弟瞻仰一下嗎XD

挖嘎:我家經費太多養得起我這種廢材 讓我在這邊練蕭威椪風 真的讓我覺得對我老闆汗顏阿XD

有限狀態自動機:對啊我原理解釋給你聽,你赫然發現你根本不知道是什麼原因,你必須做100倍而不是兩倍

挖嘎:太厲害了! 這話一聽就知道一定是好地方的高人才說得出來! 快!! 讓我見識一下XD

挖嘎:兩倍的定序(噗哧 好好好 小弟無知,大大繼續加油吧(偷笑

挖嘎:真心讓我好奇你的來歷了XD 可以私信來震攝一下小弟 看是哪位院士或者哪個機構的學者高人的高足嗎?XD

有限狀態自動機:完全不想把我的東西貼在這,根本是在汙辱我的碼.... 連吵架都是用小學生方式在吵,前因後果沒搞清楚就在斷章取義。

有限狀態自動機:我頂多只能告訴你我在替美商生技公司寫碼,薪水不太想講,碩士沒畢業領那麼高不太好意思.... 因為碼涉及商業行為,所以公司要發論文才能發

挖嘎:恩恩 所以說私信阿(真心 還有發表出來的學術文章有甚麼好不能貼連結的咧? 一般的人聽到這句話會誤以為我要你的程式碼嗎(好奇

有限狀態自動機:所以我也不介意告訴你我著作0。

有限狀態自動機:實際上碩士有著作本質上就是很奇怪的一件事,我也不用跟你解釋那麼多了。

挖嘎:喔喔 原來是碩士畢業的 辛苦了 你加油 恩恩 連公司名稱都不敢寫出來想必一定是超級機密吧 辛苦了 加油啊XD

有限狀態自動機:我在乎碼,bioinformatics的演算法是什麼鬼大家都知道,在我看來那叫做實作性論文,你們搞生科的還比那些東西有意義的多

挖嘎:喔喔喔 你加油吧 還有不好意思我不是生科的 我是學bioinformatics的 謝謝 祝你工作順利阿 晚安

有限狀態自動機:這說起來就好笑了,其實我碩士也還沒畢業(我也沒有延畢),公司在台灣才3個人,我告訴你等於告訴你我是誰了。

有限狀態自動機:學bioinformatics不知道assembly 是 reads 跟 reads alignment做的,我也只能說祝你好運。

挖嘎:挖 我還真的不記得認識的人裡面有這麼見識"高超"的高人 又在台灣才三個人的美商公司工作的耶

挖嘎:可以再給我一點點提示嗎XD

挖嘎:感謝"高人"提點 我會更加努力精進的XD

有限狀態自動機:台灣有作ngs就那幾個 泛圍夠小了 我都懷疑你是隔壁還是對面

挖嘎:我還真希望我家的學弟們程度不要真的像你這麼"高超"阿.... 頭會更痛XD

挖嘎:有在做NGS(噗哧

有限狀態自動機:原來你以為我把定序跟定序分析搞混了

有限狀態自動機:所以上面的對話全部都是你以為我把ngs當做分析技術在討論?

挖嘎:討論這兩件事情的時候 有辦法分開討論嗎? 辛苦你了 我已經了解你的程度在哪裡了 你要怎麼評價我 反正對我辦其他事情沒甚麼影響 你就加油吧XD

有限狀態自動機:自始至終我都不覺得你有聽懂我的問題,所以我一直都在找溝通到底哪個前提錯了,而現象也發現你經常段章取義,如果不是這個的話就只能是你連我的題目都不懂,

有限狀態自動機:如果你連我的問題都不懂 你怎麼會知道我的程度呢

DEATHXXX:一個27.8的博士生,文字中一堆"噗哧",你的論文裡是不是整篇都在"噗哧"啊?

DEATHXXX:尊重這兩個字你認識?

挖嘎:回樓上 不好意思我昨天晚上對一些很明顯是碰風的,而且本人也承認了的自我介紹反應過頭了 如果覺得我一直在訕笑的話我可以道歉

挖嘎:另一方面我也很讚許自動機先生對自己研究的東西的認真態度 畢竟我平常碰到的碩士生不會話這麼多,也沒這麼有自信

挖嘎:兩位如果對這些題目有興趣 真的可以私下來找我討論 我有很多的reference可以回答這些問題,請私信,要邀時間見面也可以

挖嘎:如果覺得我口說無憑 我可以拿一些已經發表的近期期刊的內容來解釋 謝謝 當然各位可能真的認為自己對這個題目認知比較清楚.研究比較透徹

挖嘎:那麼我也沒甚麼好幫忙的了 謝謝

有限狀態自動機:你就直接貼吧,我很好奇怎麼做assembly可以不用alignment

挖嘎:我沒說過不用alignment耶?一開始就是對你說"定序會貴是因為De Novo assembly" 這句話有問題

挖嘎:還有我不是貼了一個連結解釋assembly的原理給你了嗎? 請問你宣稱設計過的algorithm是 De Bruijn graph based的嗎?

挖嘎:還有既然是 "De Novo"那就不用 reference genome ,你叫我打開 aligner 是要打開甚麼東西? 對到甚麼東西上面的位子?

挖嘎:不要再浪費這邊的篇幅了 私信謝謝

johnidfet(有限狀態自動機)

首先
人類基因體計畫一直都是"宣稱"完成
實際上並沒有全部完成
現在最新的序列組合版本號叫做GRCh38 裏頭還一堆N,
N就是指ATCG都有可能,換言之就是還沒解開


其二,技術上來說,目前沒有任何方法可以保證正確的解完人類基因
頂多只能說"非常非常高的可能性"他應該是長這樣
其原因為目前我們沒有好的長序列定序技術,
而因為演算法的緣故,只要出現某一種repeat pattern比我們的定序技術可訂到的極限還長
那麼這一段repeat到底有多長就只能猜了

那麼現在來回答你的問題

1. 這是典型的被媒體汙染之後的民眾對DNA的誤解
基因實際上較多影響的是整顆細胞的環境,這種影響我們稱之為"調控"
整個序列中只有極少部分是直接控制你的"表型"(外在特徵),
這些會影響表型的基因都會產生對應的蛋白質
然後再由蛋白質產生"真正的功能"去影響你的生理狀態
所以請注意真正有功能通常都是"蛋白質",
少數RNA會有功能,
DNA則是目前認為沒有功能,完全靠產生RNA做間接調控

DNA的研究要投入臨床研究目前僅限於"診斷"
人類要透過改DNA來改變一個個體目前的技術只能是"從出生就改掉",沒辦法在後天做修改
原因是你改只能改一個細胞,那顆細胞死了就沒了
你如果想改整個人體的話就要一口氣全身(全組織或器官)細胞每顆都要改,而且是精準地改
然而我們目前沒有這種技術。

而且DNA太過上游,牽連太廣,臨床研究不好做,頂多做做診斷
所以要搞臨床多半是在搞蛋白質


2.
請用"正常"和"不正常"來區分
不要用低等高等
染色體條數每個物種都有各自的數量
目前沒有數量比較多就比較厲害的說法。

比較有道理的胡說八道是這樣 :
傳統觀念以為越複雜的生物應該基因總長要越長,因為"生物體比較複雜,所以需要更多基因和序列去描述這個生物"
這是一個很有道理的猜測,但是很遺憾是錯的

3.
這個問題稍微有意思一點
國中你學過孟德爾遺傳法則(大A小a井字遊戲那個)
這個其實就是在講個體差異性,也就是你問的"每個人的差異"
這種大A小a的區別幾乎在你所有基因裡都有
有時候他是單點多型(SNV),有時候他是缺少或多了某段序列
那麼你可以想想看假設用最簡單的形式也就是大A小a這種區別來看
如果人體有100個這種可以發生差異的點位
那全人類就會有2的100次方種組合,其中不包括後天突變
而這種差異實際上在人體已知的就有數萬個,其中還有以數量差異的方式呈現
這些差異就是導致個體差異性的原因。

另外說明,染色體的條數和基因的數量不一定是指同一件事
你多一條染色體,基因肯定會多
但是要多一點一樣的基因,不見得要多一條染色體。
對同物種來說,多一條染色體多半代表有病。


另外基因多也不見得有功能,他可能是演化上的遺物
其中一種推測是那些無用但重複的基因,其實物種在演化的時候的"備分",就跟你在寫作業的時候會經常存檔一樣
物種也演化出類似的機制來保護一些重要的基因在演化途中可以"反悔"

挖嘎:第二個問題請google C Value paradox 這1980年代就有在討論了

 
挖嘎:這樓的資訊大略上看起來沒什麼問題