搜档网
当前位置:搜档网 › 水稻基因组测序及基因功能的鉴定

水稻基因组测序及基因功能的鉴定

水稻基因组测序及基因功能的鉴定
水稻基因组测序及基因功能的鉴定

遗 传 学 报 Acta Genetica Sinica , August 2006, 33 (8):669–677 ISSN 0379-4172

Genome Sequencing and Identification of Gene Function in Rice

LIU Qing-Po, XUE Qing-Zhong ①

Department of Agronomy, College of Agriculture and Biotechnology, Zhejiang University, Hangzhou 310029, China

Abstract: Rice is known to be one of the most important crops for human consumption. As the model cereal crop, large-scale se-quencing of rice genome must play quite important roles both in theoretical research and practical application in rice breeding, which announces the opening of another new way to resolve the world food crisis. At present, the emphasis of rice genome research has been transferred from structure genomics to functional analysis. The discovery of new genes and annotation of gene function was believed to be an important issue in functional genomics research. In this article, the sequencing and functional research of the rice genome were reviewed. These results may provide some useful clues for rice genetic engineering and breeding practices. Key words: rice; genome; sequencing; functional genomics

Received: 2005-10-28; Accepted: 2005-12-07

This work was supported by the Key Research Project of Zhejiang Province (No. 2003C22007). ① Corresponding author. E-mail: qzhxue@https://www.sodocs.net/doc/119731298.html, ; Tel: +86-571-8699 9650

Human genome project (HGP), being compli-mented as life “Apollo Project”, was formally brought into effect in October 1990, which an-nounced the beginning of the informatics era for life sciences research. Bioinformatics, a new type of dis-cipline, came of age with the development of HGP. Particularly, this subject is highly interdisciplinary, using techniques and concepts from informatics, mathematics, statistics, chemistry, biochemistry, physics, and linguistics. On the one hand, bioinfor-matics aims at deriving biological knowledge from storage, retrieval, and computer analysis of genomic sequence data. On the other hand, genome projects for different organisms are producing vast amounts of sequence data, which should significantly stimulate the further development of bioinformatics.

A genome includes the entire complement of ge-netic materials in a chromosome set of an organism. The results of genome research are quite crucial for uncov-ering the essence of life and improving traits of plants and animals. At present, genome sequencing projects have either been started or completed in more than 50 model species. Some plants and animals related to hu-man living, such as maize, Rhesus monkey, cattle, elephant, and platypus, have already been chosen for the next genome sequencing (https://www.sodocs.net/doc/119731298.html,/ 10002154).

1 Rice Genome Sequencing and Its Re-search Significance

As the model plant of monocotyledon, rice is the second plant species being sequenced after dicotyle-don Arabidopsis thaliana . Among the cereal plants, genome size is the smallest in rice. Other factors that aid in the use of rice as a model plant species include the establishment of highly efficient genetic manipu-lation system, the construction of high-density ge-netic and physical maps, and high-syntenic relation-ships with other cereal genomes, attracting scientists to use rice as an excellent system for plant genomics, both for sequencing and for functional research.

The earliest rice genome project (RGP) was started in 1991 in Japan. Seven years later, another rice genome project termed International Rice Ge-nome Sequencing Project (IRGSP) was started by scientists from nine countries and from Taiwan. The members of IRGSP together announced the share of material and timely release of any new information to public database at that time. They used a single vari-

670 遗传学报 Acta Genetica Sinica V ol.33 No.8 2006

ety of rice, Oryza sativa ssp. japonica cv. Nipponbare, as the common source of DNA to avoid any allelic polymorphism. The sequencing strategy of IRGSP is a genetically anchored physical map-based clone-by-clone shotgun approach. In 2002, 2003, and 2005, the final sequences and analysis results of chromosome 1, 4, 10, 3, 11, and 12 were published separately [1-5]. As of August 2005, IRGSP had pre-sented a map-based, finished high-quality sequence that covers 95% of the 389 Mb rice genome [6].

While the IRGSP was pacing toward its target in a systematic way, in April 2000, a private sector company, Monsanto in USA, claimed that they had completed a 5X coverage of O. sativa ssp. japonica cv. Nipponbare, yielding 399 Mb sequence. To add to its effect on rice genomics and breeding, Monsanto agreed to share the data with IRGSP to accelerate the public effort. More-over, another private company, Syngenta, claimed that they had finished the draft genome sequence of Nip-ponbare in January 2001 [7]. Nearly at the same time, the draft genome sequence of O. sativa ssp. indica cv. 93-11 [8] was freely released to available public data-bases by the Beijing Genome Institute. Notably, in De-cember 2002, Chinese scientists claimed that they had completed the final genome sequence of 93-11, and published the results in the journal, PLoS Biology[9]. This was the first effort for using whole-genome shot-gun strategy to construct high-density genetic maps of higher plant genomes [10].

The completion of rice genome data, which is termed as a landmark event in life sciences, has im-portant economic and social values. From the analysis of the whole rice genome sequence, considerable amounts of genetic information can be obtained. Ac-cordingly, it is convenient to investigate the genetic mechanism involved in rice growth, development, disease resistance, high yield, and so on. The identi-fication and characterization of some important genes linked to high yield, high quality, and stress resistance would facilitate the further improvement of rice cul-tivar to a large extent. Besides, rice is known as the model plant of the cereals. Therefore, the sequencing and functional analysis of rice genome must promote studies on other important crops, such as wheat (Triti-cum aestivum L.) and maize, and the analysis can lead to a new way to resolve the world food crisis.

At present, there are four sets of rice genome data, of which three were derived from japonica rice Nipponbare, while the fourth data was from indica rice 93-11. The comparison of japonica and indica rice genome sequences showed that there were at least 1 000 000 SNPs between the two rice subspecies. Chinese scientists had already localized these SNPs to corresponding chromosomes, which is important for rice breeding practices [10]. Comparison of rice and A. thaliana genome sequences showed that 90% of the A. thaliana genes had a putative homolog in rice, whereas only 71% of rice genes had a putative homolog in A. thaliana[6]. Another interesting out-come of rice genome analysis is the discovery of unique GC-content gradient that was not present in A. thaliana[11]. These analyses will shed light on fur-ther investigation of the discrepancies between monocotyledons and dicotyledons, with respect to biochemistry and molecular evolution. For example, via comparative genomic analysis, it would be possi-ble to find the molecular mechanism of discrepancy between C3 and C4 photosynthesis pathways, and thereby to increase the yield of rice. Furthermore, the genome sequencing and analysis of rice cultivar “Peiai 64” will be completed by the Chinese re-searchers, which will be of significance for uncover-ing the mechanism of heterosis of super hybrid rice.

In addition, the centromeric region of rice chro-mosomes 4 and 8 has been sequenced, respectively [12,13], which are fundamental, both for further studying the function, stability, and duplication of centromere, and for developing transferable “artificial rice or plant chromosome”, and are propitious to the further devel-opment of cell biology.

2 Functional Research of Rice Genes

With the development of more than 50 model ge-nome projects, the emphasis of genome research has been gradually transferred from constructing high-resolution molecular genetic, physical, and transcriptional maps to

LIU Qing-Po et al.: Genome Sequencing and Identification of Gene Function in Rice 671

functional annotation of genes. Functional genomics, which mainly include transcriptomics and proteomics, is a branch of genomics that determines the biological func-tion of genes and their products using high-throughput experimental approaches [14].

2. 1 Discovery of new genes

Structure genomics research has produced a large number of sequence data that is very useful for discovering and developing new functional genes. The discovery of certain genes controlling important agronomic traits, such as disease resistance, stress resistance, lodging resistance, high yield, high quality, and so on, is beneficial for developing new rice cul-tivars. Thus, the discovery and identification of new genes have become one of the hot spots in functional genomics research.

2. 1. 1 Map-based cloning

Map-based cloning, also called positional cloning, is the process of identifying the genetic basis of a mu-tant phenotype by identifying linkage to markers, whose physical location in the genome is known. In other words, in the gene-rich region with plenty of ge-netic markers, chromosome-walking method can be used to localize and then isolate the target gene. Up to date, a series of important genes have already been cloned by employing this method, of which the first gene being cloned and characterized is the Xa21 gene conferring resistance to rice leaf blight disease. Other important genes, such as Pib, Pi-ta2, Pi5(t), Pi37(t), and Pi-k h for rice blast disease, Xa1 and Xa26(t) for bacterial blight, Sp17 for rice spotted leaf, and a gene for rice yellow mottle virus, sd-1 for semi-dwarfing, BC1 for brittleness, and MOC1 for tillering control [15], have also been isolated. However, this method is much complicated, which needs to know the molecular markers being closely linked with the gene of interest, and complementary demonstration of the function of mutants. Compared with the traditional map-based cloning, positional candidate cloning overcomes the disadvantages of map-based cloning, and stimulates the process of gene isolation to a large extent [16].

2. 1. 2 In silico cloning

Large-scale sequencing of rice Expressed Se-quence Tag (EST) has been producing a large number of EST sequences. As of June 2006, as many as 1 184 706 EST sequences have been released to the GenBank database in NCBI (release 060906). In additon, more than 28 000 full-length cDNA clones were obtained from different rice tissues, such as root, leaf, and stachys [17]. Studies have demonstrated that it was a very efficient way to isolate tissue-, organ-, and dif-ferent developmental stage-specific expressed genes by assembling EST sequences derived from the same library and homologous search in the bioinformatics databases. Lin et al.[18] characterized a new rice small GTP binding protein-coding gene, Osrab5B, on the basis of assembling five EST sequences associated with the gene of interest. Another typical example is the cloning of rice glucose-6-phosphate dehydro-genase-coding gene [19]. Huang et al. [19] isolated a 1 762 bp full-length cDNA sequence by EST assem-bling. Analysis of expression profile showed that this gene expressed in inflorescence, embryo, root, and leaf of rice, with a slightly higher expression in inflo-rescence and root [19]. In addition, the whole genome sequence of A. thaliana and the high syntenic rela-tionships among cereal plants can be utilized to in-crease the possibility and efficiency for isolating new genes in rice. Xu et al. [20] designed primers accord-ing to the published uroporphyrinogen decarboxylase (UROD) cDNA sequences from A. thaliana, wheat, tobacco, and maize, and successfully identified and isolated the rice UROD gene. Using the A. thaliana MYC protein sequence as a query, Zhu et al. [21] per-formed a TBLASTN search against the rice genome sequences and found a highly homologous sequence. The rice MYC gene was successfully cloned through experimental approaches.

Although many methods can be used to isolate and clone useful genes, it will be much better if the traditional experiments are integrated with bioinfor-matics methods, for example, using candidate clones as a query to search the internet databases.

2. 2 Functional annotation of rice genes

It was estimated that there were over 37 000 non-transposable-element-related protein-coding genes

672 遗传学报 Acta Genetica Sinica V ol.33 No.8 2006

in the japonica rice genome [6]. Accordingly, it is to be noted that the functional characterization of important genes has already become the main issue in genomics research after having completed the sequencing of rice genome.

Forward genetics and reverse genetics are the two important strategies to determine gene functions. The former, however, is a classical genetic approach, which begins with a mutant phenotype and works toward identifying the mutated gene. In contrast, the latter approach begins with a cloned segment of DNA or a protein sequence and uses this knowledge to in-troduce programmed mutations (through directed mutagenesis) back into the genome to investigate gene and protein function [22]. However, reverse genet-ics approach plays an important role in the functional annotation of useful genes in the post-genome era.

2. 2. 1 Reverse genetics research

In plants, several reverse genetic approaches have been developed, which includes gene substitu-tion, antisense or RNAi suppression, and insertional mutagenesis [23]. Terada et al. [24] demonstrated that gene substitution is feasible in rice; however, the effi-ciency is too low to be suitable for large-scale func-tional analysis of genes. In the antisense or RNAi suppression approach, functional research of a gene of interest at least needs the support of several to tens of independent transgenic lines. Compared with the two methods mentioned above, gene tagging was demonstrated to be a method of efficiently isolating genes, which does not require information on the product of genes of interest, their expression profiles, and even the association between the nucleotide se-quences and gene functions. Recently, random inser-tional mutagenesis by transposons or T-DNA has been most widely used for large-scale analyses of the functions of agronomically important genes [25,26].

Transposons, first recognized by Barbara McClintock in maize, have become a powerful tool for gene isolation. Enoki et al. [27] analyzed 559 of 6 000 Ac ele-ment-containing rice plants, and found that 18.9% of these plants contained the newly transposed Ac inser-tions. Greco et al. [28] observed that the copy number of most Ac would increase from single to three or four. Taking the insertion preference of Ac into considera-tion, they suggested that a population of about 30 000 Ac plants would be sufficient to recover knockout mu-tant in most rice genes. Moreover, a strategy using the maize Ac-Ds system has also been effectively used for gene tagging in rice. Compared with the maize Ac-Ds system, other heterologous transposable elements, such as Tag1 of A. thaliana and En-Spm of maize, showed low-transposable activity in rice. Up to date, rice mu-tant phenotypes, such as pale and yellow seedling, male sterile, colorful culm, and early heading, have been obtained by utilizing heterologous transposons. Rice has also been found to have its own retrotrans-posons and about 32 families (Tos1–Tos32) have been reported, among which Tos17 was demonstrated to be the most eminent family used for effective gene tagging. Because Tos17 can only be activated during tissue cul-ture stage, mutations induced by Tos17 insertion are fixed and inherited stably in the next generations [29]. Accordingly, genes, such as homeobox gene OSH15, rice zeaxanthin epoxidase gene (OsABA1), and rice phytochrome A (phyA), have been identified by Tos17 insertion [30]. At present, a Tos17 insertional mutant da-tabase has been established, which contains information on more than 47 000 T os17-induced insertion mutants. However, the use of Tos17 tagging genes still has some disadvantages, which include: (1) low gene-tagging ef-ficiency (about 5%–10%); (2) other mutations occurring during tissue culture. Therefore, it is necessary to de-velop new transposable elements, such as miniature Ping (mPing) and TEOS1, for gene tagging.

Compared with transposons, T-DNA insertions appear to be randomly distributed in plant genomes. Therefore, T-DNA insertion is much easier than transposon insertion to achieve near-saturation mutagenesis [26]. Collectively, scientists throughout the world have established at least 200 000 T-DNA insertion lines. Because T-DNA would rather to insert in gene-rich regions, the number of tagged lines nec-essary for saturating all the rice genes should be smaller than the estimated value [31]. With the estab-lishment of amounts of T-DNA insertion mutant da-

LIU Qing-Po et al.: Genome Sequencing and Identification of Gene Function in Rice 673

tabases [32] and insertion flanking sequence databases, T-DNA insertion lines can be widely used to study functions of valuable genes involved in metabolism, signal transduction, transporter, and cytoskeleton.

However, there are some obstacles in using the reverse genetics approach to study gene function [26]. One major obstacle is gene duplication, in which re-dundancy may result in no phenotypic alteration. The other is the maintenance and distribution of mutant seeds. Nonetheless, virus-induced gene silencing (VIGS) would be adapted as a high-throughput pro-cedure for functional genomics in plants [33]. However, application of VIGS in rice remains to be confirmed.

2. 2. 2 Large-scale gene expression profile analysis

Borevitz and Ecker [34] thought that the current stage of genomics research is the third wave of plant genomics, that is, the comparative whole-genome sequencing from multiple-related species and whole genome arrays (WGAs) should be effective for car-rying out this project.

High-throughput experimental methods are nec-essary for performing detailed analysis of genes at a genome-wide scale. Gene chip is a powerful tool for the simultaneous large-scale analyses of the expres-sion profile of an amazing array of genes. Therefore, it is easy to obtain the temporal-spatial expression profile of a gene when carefully analyzing the signals presented on the chip, which will be very significant not only for detecting new genes for high yield, high quality, and disease resistance, but also for further investigating the effects of environmental conditions on gene expression and the intrinsic mechanism of growth and development of plants.

It is comprehensive that a simple phenomenon of life is always the result of concordant action of several genes. A cDNA microarray containing 1 265 rice genes treated with probenazole was constructed by Shimono et al. [35], and it showed that about ten genes were involved in the plant–pathogen interaction. Another example of such an experiment is the use of cDNA microarray to analyze the expression of 2 200 rice genes inoculated with blast pathogens, where the expression of 20 genes were induced after 12 hours of inoculation, whereas about 18 genes were suppressed. In addition to monitoring gene expression profile un-der stress conditions, gene chip is also used to detect the expression level of genes involved in different developmental stages. Syngenta created a rice gene chip, which covers almost half of the rice genome. Zhu et al. [36] used this microarray to study the gene expression during different stages of rice grain filling, and successfully identified some important genes be-ing involved in the synthesis and transport of carbo-hydrates, proteins, and fatty acids.

Rice microarray project (RMP) that aimed at studying the functions of all the rice genes started with the Japanese RGP. Researchers systematically analyzed the EST sequences derived from the root, shoot, leaf, panicle, and also rice callus cultured in different media. They normalized the expression data and incorporated them in the rice expression database (RED) [37]. Chinese scientists also contributed to the rice functional genomics research. They have devel-oped and created the rice whole-genome chip, the chromosome 4-specific chip, and more than 20 000 cDNA microarrays; the gene expression profiles in the cases of low nitrogen, low phosphorus, drought, and seedling heterosis were systematically analyzed and the difference of expression profile between in-dica and japonica rice was further investigated (https://www.sodocs.net/doc/119731298.html,/country/nygg/nygg.jsp?n_id =610&n_type=1 & page=3).

Serial analysis of gene expression (SAGE) is a powerful technique that can be used for global analy-sis of gene expression, which allows for a rapid and detailed analysis of the abundance of thousands of transcripts in a single attempt [38,39]. This technique has already been successfully applied to research transcriptomics in a particular cell or tissue type and to detect the changes in expression of abundant mRNA in different populations.

2. 3 Functional analysis of genes using proteomics

approach

The analysis of proteins is the most direct ap-proach to define gene function. Over the past few years, remarkable progress has been made and rice

674 遗传学报 Acta Genetica Sinica V ol.33 No.8 2006

proteomics databases have been established. Notably, lots of proteins from rice tissues and organelles were analyzed and identified. The results showed that most proteins exhibited a tissue or organelle-specific ex-pression pattern [40]. Using 2D-PAGE, it is convenient to sequence the N-terminus of target protein spots. The sequenced fragments can be used to perform homologous search of the rice cDNA libraries. In principle, if the libraries are large enough, it is easy to fix the nucleotide sequence of the corresponding gene and then primarily annotate it.

In addition, comparative analysis of the pro-teomes of wild-type genotype and knockout mutant would be very useful for inferring the function of the target gene. For example, Komatsu et al. [41] carried out a comparative proteome investigation on green and etiolated shoots of rice seedlings. These authors demonstrated that photosynthetic proteins presented in green shoots as expected, whereas only precursors of these proteins were identified in etiolated shoots. In contrast, the L-ascorbate peroxidase only presented in etiolated shoots, suggesting a cellular protectant function for this antioxidant enzyme in the latter [41].

3 Research “Hot” Spots of Bioinformatics

in Genomics

Bioinformatics is playing increasingly signifi-cant roles in the study of modern biology. It is cur-rently regular for biologists to refer to a few bioin-formatics databases before designing research pro-jects or experiments that uses bioinformatics methods to uncover biological meanings underneath genomic sequence data. To the other extreme, a large number of sequences derived from different genome projects urgently promote to develop advanced mathematical or statistical algorithms and computational method-ologies to analyze the data.

Ten thousands of genome sequences have been produced from different genome projects. Thus, the question of uncovering the biological knowledge of genetic code becomes the most important issue in the post-genome era. From the recent progress made over the years in bioinformatics research [42,43], it can be concluded that the following issues should be empha-sized: (1) genome structure analysis of special species;

(2) database construction and data integration; (3) development of new gene prediction algorithms and programs; (4) development of new software for pre-dicting translation initiation position of different spe-cies; (5) genome data mining, such as discovery of new gene and new single nucleotide polymorphisms (SNP), and functional research of genes; (6) gene regulation network and systemic biology; (7) protein structure threading, prediction, and functional re-search; (8) proteomics and comparative genomics; (9) model construction of metabolism network and analysis; (10) structure analysis of non-coding region; and (11) studies on origination and expansion of ge-netic code, biological evolution, and so on. This goes to say that bioinformatics has paved a way for a better understanding of the real meaning of genetic code. In other words, it would create significant economic and social benefits from uncovering the rules of biologi-cal inheritance language as well as clearly clarifying some great natural and philosophical issues in biology, which must promote the healthy development of life sciences research.

References:

[1] Sasaki T, Matsumoto T, Yamamoto K, Sakata K, Baba T,

Katayose Y, Wu J, Niimura Y, Cheng Z, Nagamura Y,

Antonio B A, Kanamori H, Hosokawa S, Masukawa M, Arikawa K, Chiden Y, Hayashi M, Okamoto M, Ando T,

Aoki H, Arita K, Hamada M, Harada C, Hijishita S, Honda M, Ichikawa Y, Idonuma A, Iijima M, Ikeda M, Ikeno M, Ito S, Ito T, Ito Y, Ito Y, Iwabuchi A, Kamiya K,

Karasawa W, Katagiri S, Kikuta A, Kobayashi N, Kono I,

Machita K, Maehara T, Mizuno H, Mizubayashi T, Mukai

Y, Nagasaki H, Nakashima M, Nakama Y, Nakamichi Y, Nakamura M, Namiki N, Negishi M, Ohta I, Ono N, Saji

S, Sakai K, Shibata M, Shimokawa T, Shomura A, Song J, Takazaki Y, Terasawa K, Tsuji K, Waki K, Yamagata H, Yamane H, Yoshiki S, Yoshihara R, Yukawa K, Zhong H,

Iwama H, Endo T, Ito H, Hahn J H, Kim H I, Eun M Y,

Yano M, Jiang J, Gojobori T. The genome sequence and structure of rice chromosome 1. Nature, 2002, 420 : 312-316.

[2] Feng Q, Zhang Y, Hao P, Wang S, Fu G, Huang Y, Li Y,

Zhu J, Liu Y, Hu X, Jia P, Zhang Y, Zhao Q, Ying K, Yu S, Tang Y, Weng Q, Zhang L, Lu Y, Mu J, Lu Y, Zhang L S,

LIU Qing-Po et al.: Genome Sequencing and Identification of Gene Function in Rice 675

Yu Z, Fan D, Liu X, Lu T, Li C, Wu Y, Sun T, Lei H, Li T, Hu H, Guan J, Wu M, Zhang R, Zhou B, Chen Z, Chen L, Jin Z, Wang R, Yin H, Cai Z, Ren S, Lü G, Gu W, Zhu G, Tu Y, Jia J, Zhang Y, Chen J, Kang H, Chen X, Shao C, Sun Y, Hu Q, Zhang X, Zhang W, Wang L, Ding C, Sheng H, Gu J, Chen S, Ni L, Zhu F, Chen W, Lan L, Lai Y, Cheng Z, Gu M, Jiang J, Li J, Hong G, Xue Y, Han B.

Sequence and analysis of rice chromosome 4. Nature, 2002, 420 : 316-320.

[3] Rice Chromosome 10 Sequencing Consortium. In-depth

view of structure, activity, and evolution of rice chromo-

some 10. Science, 2003, 300 : 1566-1569.

[4] Rice Chromosome 3 Sequencing Consortium. Sequence,

annotation, and analysis of synteny between rice chro-

mosome 3 and diverged grass species. Genome Res, 2005,

15 : 1284-1291.

[5] Rice Chromosomes 11 and 12 Sequencing Consortia. The

sequence of rice chromosomes 11 and 12, rich in disease resistance genes and recent gene duplications. BMC Biol, 2005, 3 : 20.

[6] International Rice Genome Sequencing Project. The

map-based sequence of the rice genome. Nature, 2005, 436 : 793-800.

[7] Goff S A, Ricke D, Lan T H, Presting G, Wang R, Dunn

M, Glazebrook J, Sessions A, Oeller P, Varma H, Hadley D, Hutchison D, Martin C, Katagiri F, Lange B M, Moughamer T, Xia Y, Budworth P, Zhong J, Miguel T, Paszkowski U, Zhang S, Colbert M, Sun W L, Chen L, Cooper B, Park S, Wood T C, Mao L, Quail P, Wing R, Dean R, Yu Y, Zharkikh A, Shen R, Sahasrabudhe S, Thomas A, Cannings R, Gutin A, Pruss D, Reid J, Tav-

tigian S, Mitchell J, Eldredge G, Scholl T, Miller R M, Bhatnagar S, Adey N, Rubano T, Tusneem N, Robinson R, Feldhaus J, Macalma T, Oliphant A, Briggs S. A draft se-

quence of the rice genome (Oryza sativa L. ssp. japonica).

Science, 2002, 296 : 92-100.

[8] Yu J, Hu S, Wang J, Wong G K, Li S, Liu B, Deng Y, Dai L,

Zhou Y, Zhang X, Cao M, Liu J, Sun J, Tang J, Chen Y, Huang X, Lin W, Ye C, Tong W, Cong L, Geng J, Han Y, Li L, Li W, Hu G, Huang X, Li W, Li J, Liu Z, Li L, Liu J, Qi Q, Liu J, Li L, Li T, Wang X, Lu H, Wu T, Zhu M, Ni P, Han H, Dong W, Ren X, Feng X, Cui P, Li X, Wang H, Xu X, Zhai W, Xu Z, Zhang J, He S, Zhang J, Xu J, Zhang K, Zheng X, Dong J, Zeng W, Tao L, Ye J, Tan J, Ren X, Chen X, He J, Liu D, Tian W, Tian C, Xia H, Bao Q, Li G, Gao H, Cao T, Wang J, Zhao W, Li P, Chen W, Wang X, Zhang Y, Hu J, Wang J, Liu S, Yang J, Zhang G, Xiong Y, Li Z, Mao L, Zhou C, Zhu Z, Chen R, Hao B, Zheng W, Chen S, Guo W, Li G, Liu S, Tao M, Wang J, Zhu L, Y uan L, Yang H. A draft sequence of the rice genome (Oryza sativa L. ssp. in-

dica). Science, 2002, 296 : 79-92.

[9] Yu J, Wang J, Lin W, Li S, Li H, Zhou J, Ni P, Dong W,

Hu S, Zeng C, Zhang J, Zhang Y, Li R, Xu Z, Li S, Li X, Zheng H, Cong L, Lin L, Yin J, Geng J, Li G, Shi J, Liu J, Lv H, Li J, Wang J, Deng Y, Ran L, Shi X, Wang X, Wu Q, Li C, Ren X, Wang J, Wang X, Li D, Liu D, Zhang X, Ji Z, Zhao W, Sun Y, Zhang Z, Bao J, Han Y, Dong L, Ji J, Chen P, Wu S, Liu J, Xiao Y, Bu D, Tan J, Yang L, Ye C, Zhang J, Xu J, Zhou Y, Yu Y, Zhang B, Zhuang S, Wei H, Liu B, Lei M, Y u H, Li Y, Xu H, Wei S, He X, Fang L, Zhang Z, Zhang Y, Huang X, Su Z, Tong W, Li J, Tong Z, Li S, Ye J, Wang L, Fang L, Lei T, Chen C, Chen H, Xu Z, Li H, Huang H, Zhang F, Xu H, Li N, Zhao C, Li S, Dong L, Huang Y, Li L, Xi Y, Qi Q, Li W, Zhang B, Hu W, Zhang Y, Tian X, Jiao Y, Liang X, Jin J, Gao L, Zheng W, Hao B, Liu S, Wang W, Yuan L, Cao M, McDermott J, Samudrala R, Wang J, Wong G K, Yang H. The genomes of Oryza sativa: a history of duplications. PLoS Biol, 2005, 3 : 266-281.

[10] Beijing Genome Institute. The mapping of the working

draft and the fine map of the rice genome (Oryza sativa L.

ssp indica). Bull Chinese Acad Sci, 2003, 1 : 29-31 (in Chinese with an English abstract).

[11] Wong G K S, Wang J, Tao L, Tan J, Zhang J, Passey D A,

Yu J. Compositional gradients in Gramineae genes. Ge-

nome Res, 2002, 12 : 851-856.

[12] Wu J, Yamagata H, Hayashi-Tsugane M, Hijishita S,

Fujisawa M, Shibata M, Ito Y, Nakamura M, Sakaguchi M, Yoshihara R, Kobayashi H, Ito K, Karasawa W, Yamamoto M, Saji S, Katagiri S, Kanamori H, Namiki N, Katayose Y, Matsumoto T, Sasaki T. Composition and structure of the centromeric region of rice chromosome 8.

Plant Cell, 2004, 16 : 967-976.

[13] Zhang Y, Huang Y, Zhang L, Li Y, Lu T, Lu Y, Feng Q,

Zhao Q, Cheng Z, Xue Y, Wing R A, Han B. Structural features of the rice chromosome 4 centromere. Nucleic Acids Res, 2004, 32 : 2023-2030.

[14] Hieter P, Boguski M. Functional genomics: it’s all how

you read it. Science, 1997, 278 : 601-602.

[15] Li X, Qian Q, Fu Z, Wang Y, Xiong G, Zeng D, Wang X,

Liu X, Teng S, Hiroshi F, Yuan M, Luo D, Han B, Li J.

Control of tillering in rice. Nature, 2003, 422 : 618-621.

[16] Collins F S. Positional cloning moves from perditional to

traditional. Nature Genet, 1995, 9:347-350.

[17] Kikuchi1 S, Satoh K, Nagata T, Kawagashira N, Doi K,

Kishimoto N, Yazaki J, Ishikawa M, Yamada H, Ooka H.

Collection, mapping, and annotation of over 28000 cDNA clones from japonica rice. Science, 2003, 301 : 376-379.

[18] Lin H X, Liu X B, Li F Q, Luo W Y, Liu L S. Cloning and

676 遗传学报 Acta Genetica Sinica V ol.33 No.8 2006

characterization of a rice small GTP-binding protein gene Osrab5B. High Technol Lett, 2001, 3 : 9-14 (in Chinese with an English abstract).

[19] Huang J, Wang J F, Zhang H S, Cao Y J, Lin C F, Wang D,

Yang J S. In silico cloning of glucose-6-phosphate dehy-

drogenase cDNA from rice (Oryza sativa L.). Acta Genet Sin, 2002, 29(11) : 1012-1016 (in Chinese with an English abstract).

[20] Xu J C, Liu G Z, Li X Z, Xiao H, Li X B, Li H C, Wei L

R, Zhu L H. In silico cloning and identification of rice uroporphyrinogen decarboxylase encoding gene. Pro-

gress Nat Sci, 2004, 14 (1) : 64-69 (in Chinese with an English abstract).

[21] Zhu Z F, Sun C Q, Fu Y C, Qian X Y, Yang J S, Wang X

K. Isolation and analysis of a novel MYC gene from rice.

Acta Genet Sin, 2005, 32(4) : 393-398 (in Chinese with an English abstract).

[22] An G, Jeong D H, Jung K H, Lee S. Reverse genetic ap-

proaches for functional genomics of rice. Plant Mol Biol, 2005, 59 : 111-123.

[23] May S T, Clements D, Bennett M J. Finding your knock-

out: reverse genetics techniques for plants. Mol Biotech-

nol, 2002, 20; 209-221.

[24] Terada R, Urawa H, Inagaki Y, Tsugane K, Iida S. Effi-

cient gene targeting by homologous recombination in rice.

Nature Biotechnol, 2002, 20 : 1030-1034.

[25] Ramachandran S, Sundaresan V. Transposons as tools for

functional genomics. Plant Physiol Biochem, 2001, 39 : 243-252.

[26] An G, Lee S, Kim S H, Kim S R. Molecular genetics using

T-DNA in rice. Plant Cell Physiol, 2005, 46 : 14-22. [27] Enoki H, Izawa T, Kawahara M, Komatsu M, Koh S,

Kyozuka J, Shimamoto K. Ac as a tool for the functional genomics of rice. Plant J, 1999, 19 : 605-613.

[28] Greco R, Ouwerkerk P B, Taal A J, Favalli C, Beguiris-

tain T, Puigdomenech P, Colombo L, Hoge J H, Pereira A.

Early and multiple Ac transpositions in rice suitable for efficient insertional mutagenesis. Plant Mol Biol, 2001,

46 : 215-227.

[29] Hirochika H. Retrotransposons of rice: their regulation

and use for genome analysis. Plant Mol Biol, 1997, 35 : 231-240.

[30] Hirochika H. Contribution of the Tos17 retrotransposon to

rice functional genomics. Curr Opin Plant Biol, 2001, 4 : 118-122. [31] Sallaud C, Gay C, Larmande P, Bes M, Piffanelli P, Piegu

B, Droc G, Regad F, Bourgeois E, Meynard D, Perin C,

Sabau X, Ghesquiere A, Glaszmann J C, Delseny M, Guiderdoni E. High throughput T-DNA insertion mutagenesis in rice: a first step towards in silico reverse

genetics. Plant J, 2004, 39 : 450-464.

[32] Yan S Y, Zhi Q W, Liu X J, Zhang H W, Tan Z B, Li S G.

Generation and identification of rice T-DNA insertional mutant lines. Acta Genet Sin, 2004, 31(12): 1388-1394

(in Chinese with an English abstract).

[33] Baulcombe D C. Fast forward genetics based on vi-

rus-induced gene silencing. Curr Opin Plant Biol, 1999,

2 : 109-113.

[34] Borevitz J O, Ecker J R. Plant genomics: the third wave.

Annu Rev Genom Hum G, 2004, 5 : 443-477.

[35] Shimono M, Yazaki J, Nakamura K, Kishimoto N, Kiku-

chi S, Iwano M, Yamamoto K, Sakata K, Sasaki T, Ni-

shiguchi M. cDNA microarray analysis of gene expres-

sion in rice plants treated with probenazole, a chemical inducer of disease resistance. J Gene Plant Pathol, 2003,

69 : 76-82.

[36] Zhu T, Budworth P, Chen W, Provart N, Chang H S,

Guimil S, Su W, Estes B, Zou G, Wang X. Transcriptional

control of nutrient partitioning during rice grain filling.

Plant Biotechnol J, 2003, 1 : 59-70.

[37] Yazaki J, Kishimoto N, Ishikawa M, Kikuchi S. Rice

expression database: the gateway to rice functional ge-

nomics. Trends Plant Sci, 2002, 7 : 563-564.

[38] Velculescu V E, Zhang L, V ogelstein B, Kinzler K W.

Serial analysis of gene expression. Science, 1995, 270 : 484-487.

[39] Tuteja R, Tuteja N. Serial analysis of gene expression

(SAGE): unraveling the bioinformatics tools. BioEssays,

2004, 26 : 916-922.

[40] Khan M M K, Komatsu S. Rice proteomics: recent de-

velopments and analysis of nuclear proteins. Phytochem-

istry, 2004, 65 : 1671-1681.

[41] Komatsu S, Muhammad A, Rakwal R. Separation and

characterization of proteins from green and etiolated shoots of rice (Oryza sativa L.): towards a rice proteome.

Electrophoresis, 1999, 20 : 630-636.

[42] Yu U, Lee S H, Kim Y J, Kim S. Bioinformatics in the

post-genome era. J Biochem Mol Biol, 2004, 37 : 75-82. [43] Costa Lda F. Bioinformatics: perspectives for the future.

Genet Mol Res, 2004, 3 : 564-574.

LIU Qing-Po et al.: Genome Sequencing and Identification of Gene Function in Rice 677

水稻基因组测序及基因功能的鉴定

刘庆坡,薛庆中

浙江大学农业与生物技术学院农学系,杭州310029

摘要:水稻是重要的粮食作物。作为单子叶模式植物,水稻基因组的大规模测序具有巨大的理论价值和现实意义。目前已获得了籼稻“93-11”和粳稻“日本晴”高质量的基因组数据,这为在基因组水平上深入研究其生长、发育、抗病和高产等的遗传机理提供了便利,从而为进一步解决世界粮食危机提供了新的突破口和契机。随着水稻基因组计划的顺利结束,其研究重心也已由建立高分辨率的遗传、物理和转录图谱为主的结构基因组学转向基因功能的研究。结构基因组学研究获得的大量序列数据为揭示和开发功能基因开辟了广阔的前景。目前,利用图位克隆和电子克隆等方法已成功分离了多个水稻抗病、抗虫、抗逆境、抗倒伏、高产、优质等重要农艺性状相关的基因,对培育水稻新品种,促进农业的可持续发展意义重大。据估计,水稻至少拥有3.7万个非转座因子相关的蛋白编码基因。因此,完成全基因组序列测定后,重要基因功能的鉴定已成为当前基因组学研究的主要目标。反向遗传学、大规模基因功能表达谱分析和蛋白质组研究等策略已在研究水稻重要基因的功能方面发挥了重要作用。文章综述了水稻基因组测序及基因功能研究的现状,并就新基因发掘和基因功能注释的方法作了评述,期待为水稻遗传工程和育种实践提供参考。

关键词:水稻;基因组;测序;功能基因组学

作者简介:刘庆坡(1976-),男,河北曲阳人,博士后,研究方向:水稻基因组

水稻基因组测序及基因功能的鉴定

作者:刘庆坡, 薛庆中, LIU Qing-Po, XUE Qing-Zhong

作者单位:浙江大学农业与生物技术学院农学系,杭州,310029

刊名:

遗传学报

英文刊名:ACTA GENETICA SINICA

年,卷(期):2006,33(8)

被引用次数:5次

参考文献(43条)

1.Sasaki T.Matsumoto T.Yamamoto K.Sakata K Baba T Katayose Y Wu J Niimura Y Cheng Z Nagamura Y Antonio B A Kanamori H Hosokawa S Masukawa M Arikawa K Chiden Y Hayashi M Okamoto M Ando T Aoki H Arita K Hamada M Harada C Hijishita S Honda M Ichikawa Y Idonuma A Iijima M Ikeda M Ikeno M Ito The genome sequence and structure of rice chromosome 1 2002

2.Feng Q.Zhang Y.Hao P.Wang S, Fu G, Huang Y, Li Y, Zhu J, Liu Y Sequence and analysis of rice chromosome 4 2002

3.Rice Chromosome 10 Sequencing Consortium In-depth view of structure,activity,and evolution of rice chromosome 10 2003

4.Rice Chromosome 3 Sequencing Consortium Sequence,annotation,and analysis of synteny between rice chromosome 3 and diverged grass species 2005

5.Rice Chromosomes 11 and 12 Sequencing Consortia The sequence of rice chromosomes 11 and 12,rich in disease resistance genes and recent gene duplications 2005(03)

6.International Rice Genome Sequencing Project The map-based sequence of the rice genome 2005

7.Goff S A.Ricke https://www.sodocs.net/doc/119731298.html,n T H.Presting G Wang R, Dunn M, Glazebrook J, Sessions A, Oeller P,Varma H,Hadley D,Hutchison D,Martin C,Katagiri F,Lange B M,Moughamer T,Xia Y,Budworth P,Zhong J,Miguel T,Paszkowski U,Zhang S,Colbert M,Sun W

L,Chen L,Cooper B,Park S,Wood T C,Mao L,Quail P,W A draft sequence of the rice genome (Oryza sativa L.ssp.japonica) 2002

8.Yu J.Hu S.Wang J.Wong G K, Li S, Liu B, Deng Y,Dai L,Zhou Y,Zhang X,Cao M,Liu J,Sun J,Tang J,Chen Y,Huang X,Lin W,Ye C,Tong W,Cong L,Geng J,Han Y,Li L,Li W,Hu G,Huang X,Li W,Li J,Liu Z,Li L,Liu J,Qi Q,Liu J,Li L,Li T,Wang X,Lu H,Wu

T,Zhu M,Ni P,Han H,Dong W,Ren X,Feng X A draft sequence of the rice genome (Oryza sativa L.ssp.indica) 2002

9.Yu J.Wang J.Lin W.Li S Li H Zhou J Ni P Dong W Hu S Zeng C Zhang J Zhang Y Li R Xu Z Li S Li X Zheng H Cong L Lin L Yin J Geng J Li G Shi J Liu J Lv H Li J Wang J Deng Y Ran L Shi X Wang X Wu Q Li C Ren X Wang J Wang X Li D Liu D Zhang X Ji Z Zhao W Sun Y Zhang Z Bao J Ha The genomes of Oryza sativa:a history of duplications 2005(03)

10.Beijing Genome Institute The mapping of the working draft and the fine map of the rice genome (Oryza sativa L.ssp indica)[期刊论文]-Bulletin of the Chinese Academy of Sciences 2003(01)

11.Wong G K S.Wang J.Tao L.Tan J Zhang J Passey D A Yu J Compositional gradients in Gramineae genes 2002(12)

12.Wu J.Yamagata H.Hayashi-Tsugane M.Hijishita S Fujisawa M Shibata M Ito Y Nakamura M Sakaguchi M Yoshihara R Kobayashi H Ito K Karasawa W Yamamoto M Saji S Katagiri S Kanamori H Namiki N Katayose Y Matsumoto T Sasaki T Composition and structure of the centromeric region of rice chromosome 8 2004

13.Zhang Y.Huang Y.Zhang L.Li Y Lu T Lu Y Feng Q Zhao Q Cheng Z Xue Y Wing R A Han B Structural features of the rice chromosome 4 centromere 2004

14.Hieter P.Boguski M Functional genomics:it's all how you read it 1997

15.Li X.Qian Q.Fu Z.Wang Y Xiong G Zeng D Wang X Liu X Teng S Hiroshi F Yuan M Luo D Han B Li J Control of tillering in rice 2003

16.Collins F S Positional cloning moves from perditional to traditional 1995(09)

17.Kikuchil S.Satoh K.Nagata T.Kawagashira N Doi K Kishimoto N Yazaki J Ishikawa M Yamada H Ooka H

Collection,mapping,and annotation of over 28000 cDNA clones from japonica rice 2003

18.Lin H X.Liu X B.Li F Q.Luo W Y Liu L S Cloning and characterization of a rice small GTP-binding protein gene Osrab5B [期刊论文]-High Technology Letters 2001(03)

19.HUANG Ji.WANG Jian-Fei.ZHANG Hong-Sheng.CAO Ya-Jun, LIN Chang-Fa, WANG Dong, YANG Jin-Shui In silico cloning of

glucose-6-phosphate dehydrogenase cDNA from rice (Oryza sativa L.)[期刊论文]-Acta Genetica Sinica 2002(11)

20.Xu J C.Liu G Z.Li X Z.Xiao H Li X B Li H C Wei L R Zhu L H In silico cloning and identification of rice uroporphyrinogen decarboxylase encoding gene 2004(01)

21.Zhu Z F.Sun C Q.Fu Y C.Qian X Y Yang J S Wang X K Isolation and analysis of a novel MYC gene from rice[期刊论文]-Acta Genetica Sinica 2005(04)

22.An G.Jeong D H.Jung K H.Lee S Reverse genetic approaches for functional genomics of rice 2005

23.May S T.Clements D.Bennett M J Finding your knockout:reverse genetics techniques for plants 2002(20)

24.Terada R.Urawa H.Inagaki Y.Tsugane K Iida S Efficient gene targeting by homologous recombination in rice 2002

25.Ramachandran S.Sundaresan V Transposons as tools for functional genomics 2001

26.An G.Lee S.Kim S H.Kim S R Molecular genetics using T-DNA in rice 2005

27.Enoki H.Izawa T.Kawahara M.Komatsu M Koh S Kyozuka J Shimamoto K Ac as a tool for the functional genomics of rice 1999

28.Greco R.Ouwerkerk P B.Taal A J.Favalli C Beguiristain T Puigdomenech P Colombo L Hoge J H Pereira A Early and multiple Ac transpositions in rice suitable for efficient insertional mutagenesis 2001

29.Hirochika H Retrotransposons of rice:their regulation and use for genome analysis 1997

30.Hirochika H Contribution of the Tos1 7 retrotransposon to rice functional genomics 2001(04)

31.Sallaud C.Gay https://www.sodocs.net/doc/119731298.html,rmande P.Bes M Piffanelli P Piegu B Droc G Regad F Bourgeois E Meynard D Perin C Sabau X Ghesquiere A Glaszmann J C Delseny M Guiderdoni E High throughput T-DNA insertion mutagenesis in rice:a first step towards in silico reverse genetics 2004

32.Yah S Y.Zhi Q W.Liu X J.Zhang H W Tan Z B Li S G Generation and identification of rice T-DNA insertional mutant lines[期刊论文]-Acta Genetica Sinica 2004(12)

33.Baulcombe D C Fast forward genetics based on virus-induced gene silencing 1999(02)

34.Borevitz J O.Ecker J R Plant genomics:the third wave 2004(05)

35.Shimono M.Yazaki J.Nakamura K.Kishimoto N Kikuchi S Iwano M Yamamoto K Sakata K Sasaki T Nishiguchi M cDNA microarray analysis of gene expression in rice plants treated with probenazole,a chemical inducer of disease resistance 2003

36.Zhu T.Budworth P.Chen W.Provart N Chang H S Guimil S Su W Estes B Zou G Wang X Transcriptional control of nutrient partitioning during rice grain filling 2003(01)

37.Yazaki J.Kishimoto N.Ishikawa M.Kikuchi S Rice expression database:the gateway to rice functional genomics 2002(07)

38.Velculescu V E.Zhang L.Vogelstein B.Kinzler K W Serial analysis of gene expression 1995

39.Tuteja R.Tuteja N Serial analysis of gene expression (SAGE):unraveling the bioinformatics tools 2004

40.Khan M M K.Komatsu S Rice proteomics:recent developments and analysis of nuclear proteins 2004

41.Komatsu S.Muhammad A.Rakwal R Separation and characterization of proteins from green and etiolated shoots of rice (Oryza sativa L.):towards a rice proteome 1999

42.Yu U.Lee S H.Kim Y J.Kim S Bioinformatics in the post-genome era 2004

43.Costa Lda F Bioinformatics:perspectives for the future 2004(03)

相似文献(10条)

1.学位论文田朝光水稻和拟南芥GRAS基因家族的比较分析&水稻基因组多倍体起源的探讨2004

本论文主要涉及两部分内容:第一部分是水稻和拟南芥GRAS基因家族的全基因组水平比较分析;第二部分是水稻基因组多倍体起源的探讨。

GRAS家族编码转录因子,该家族基因在植物生长发育如赤霉素信号传导、根的发育、分生组织的形成、光敏色素A信号传导以及雄配子发育等方面具有重要作用。通过生物信息学方法,在水稻基因组中鉴定了57个GRAS基因,在拟南芥基因组中鉴定了32个GRAS基因。本文对这一基因家族进行了全面分析,包括基因结构、基因表达、染色体定位、结构域组成模式及家族系统进化等,并对水稻和拟南芥基因组中该家族情况进行了比较分析。系统进化分析表明该家族可以分为8个亚家族,每个亚家族具有独特的氨基酸组成和特异的基因功能。GRAS基因家族成员的扩展,既有来自基因组加倍形成的,也有由基因串联复制而成。GRAS基因家族是一个古老的基因家族,在至少有大约4亿年历史的苔藓类植物也能够找到该家族成员。

基因加倍一直是进化的重要推动力之一。古老的基因组加倍事件已经在多个物种中被确定,包括酵母,脊椎动物,和拟南芥。本研究发现水稻基因组同样存在全基因组加倍事件,大概发生在禾谷类作物分化之前,距今约50-70Mya(百万年)。在水稻基因组中,共找到117个加倍区段(duplicationblock),分布在水稻的全部12条染色体,覆盖约60%的水稻基因组。在加倍区段,大约有20%的基因保留了加倍后的姐妹基因对(duplicatedpairs)。与此形成鲜明对照的是加倍区段的转录因子保留了60%的姐妹基因。禾谷类作物全基因组加倍事件的确定对研究他们基因组的进化具有重要影响,暗示了禾谷类作物多倍体化及随后的基因丢失、染色体重排在禾谷类物种分化中扮演了重要角色。

2.期刊论文郭龙彪.程式华.钱前水稻基因组测序和分析的研究进展-中国水稻科学2004,18(6)

综述了水稻基因组测序的工作进展和水稻基因组信息.至2002年,籼、粳稻两个亚种基因组工作"框架图"的测定及粳稻基因组全长序列的精确测定已相继完成.初步得到了水稻非冗余序列389.81~409.76 Mb;预测水稻基因总数达32 000~56 000个,少于30%的基因被功能分类;基因内GC含量梯度明显;外显子变异少、内含子变化大;籼稻和粳稻的序列差异达22%以上;水稻与其他禾谷类基因之间有广泛的共线性,但与拟南芥的共线性是有限的.基因组测序不仅开辟了基因组学这一生命科学的新兴学科,而且带动了生物信息学、蛋白质组学等一批新兴学科和技术的发展.

3.学位论文王向峰水稻转录组学与表观遗传学分析——应用覆瓦式芯片对水稻基因组转录活性,DNA甲基化和组蛋白修饰的分析2007 基因芯片技术(DNA Microarray)已广泛地应用于生物学研究的各个领域,并成为大规模检测基因表达活性的基本手段。覆瓦式芯片,即Tiling-path Microarrav是一种在整个基因组范围内无偏地检测所有功能元件转录活性的芯片设计思路,具有比传统基因芯片更多的用途,例如:对基因组的注释信息提供实验证据,对预测基因结果进行验证和修改,对基因组中未注释的转录单元的检测,寻找可变剪接的内含子、外显子等等。本论文主要介绍应用覆瓦式芯片对水稻基因组的转录活性以及水稻基因组DNA甲基化与组蛋白修饰研究的一系列结果。

第一部分主要介绍针对处理NimbleGen芯片数据而开发的软件包——-NMPP (NimbleGen Microarray data Processing Pipeline)。NMPP整合了Affymetrix MAS

5.0,RMA(Robust Multi-Array Average)等几种目前流行的处理单通道高密度寡核苷酸芯片数据的算法,采用集中处理模式,高效快捷地完成大规模基因芯片表达数据的提取,加工,储存与分析。NMPP不仅可以应用于对传统的基因表达芯片的数据处理,也可以广泛的应用于免疫共沉淀芯片(ChiP-on-Chip),比较基因组杂交(Comparative Genome Hybridization)芯片,单核苷酸多态性再测序(SNPre-sequencingl)等基于Tiling-path设计的芯片的原始数据处理。

第二部分内容首先介绍基于PCR扩增基因组DNA片段为探针(平均3 Kb)的Tiling Array对水稻四号染色体的转录活性分析,以及不同基因区域的转录活性在不同发育阶段的变化情况。在这项研究中,作者发现在水稻发育的早期阶段(根,茎,苗期)主要是编码蛋白的基因高度表达,而与转座子元件相关的基因受到抑制;而在水稻发育后期的成熟组织中(花穗,旗叶),转座子元件的转录活性被大规模地激活了,而编码蛋白的基因受到了抑制。这一现象实际上与4号染色体在不同发育阶段,染色体结构的异染色质化与去异染色质化的调节有关。

其次介绍应用高密度覆瓦式芯片(Tiling array)对水稻其中一个亚种——籼稻(indica),进行的全基因组范围转录活性分析。该Tiling-pam芯片的基因表达数据对水稻

35,970(81.9%)个注释基因的表达活性提供了实验依据,并检测到5,646个基因间区域的信号簇,可能是目前算法和软件无法预测的新基因。通过与植物EST数据库比对发现其中近30%的序列与植物基因存在同源性,并成功地克隆到了部分新基因的序列。Tiling-alTav在每条染色体上的信号强度分布图谱,揭示了染色体上基因转录活性的分布与染色质细胞学结构特征有着密切的联系,并依据Tiling Array在1号和4号染色体上的信号分布,通过FISH实验准确地确定了这两条染色体的常染色质区与异染色质区的边界。最后作者比较了水稻indica基因组上18对片段复制(segmental duplication)区域的转录活性,发现部分复制区域的转录活性在整体上具有一定相关性,尤其是11号和12号染色体上一对距离现代发生最近的(53 MYA)一次基因组片段复制区域,表达信号的相关性高达0.731,暗示着这两个复制区域中的基因功能尚未完全分化,还存在相似的表达行为。最后,作者详细地介绍对水稻(J~aponica)基因组中新转录活性区(TAR,NovelTranscription Active Region)的系统分析。水稻(japonica)Tiling Array共检测到存在于基因间区域的25,346个TAR,对这些TAR的表达谱分析证明,83%的TAR在10个水稻组织器官中具有表达活性,并处于相对等量的表达水平,只有近2%的TAR具有组织特异性。全面系统的分析对80%的TAR进行了细致的解释,并按照不同基因组功能单元进行了归类:例如,有些TAR是具有可变剪接基因的产物,有些TAR是某些基因反义链上的转录产物,有些是转座子携带的基因复制片段,有些则可能是非编码RNA的前体。

第三部分将介绍应用TilingArray对水稻基因组中4号和10号染色体的:DNA甲基化(DNA methylation)和两种组蛋白修饰(histone modification)——H3K4Me3和H3K4Me2的分析结果。DNA甲基化,H3K4Me3和H3K4Me2的定位图谱(Mapping)表明,三种修饰都在靠基因的5’端有较高水平的修饰。基因组中的转座子等重复序列区的DNA甲基化水平很高,起到对转座子转录活性的抑制作用,而基因上以H3K4Me3和H3K4Me2为主要修饰,具有促进基因表达的作用。此外,作者将三种修饰的位点与基因组中的CpG岛,tRNA,非编码RNA,T-DNA插入位点,Tos-17插入位点进行了图谱定位,不同的基因组位点都具有不同的修饰模式。

三种修饰对表达的作用方式具有一定的位置效应,DNA甲基化高频率地发生在基因转录区(Gene bode),并且只有发生在转录区才能在某种程度上抑制基因表达活性,而如果DNA甲基化发生在上游启动子区,则没有明显的抑制基因表达的作用。H3K4Me3发生在基因启动区和转录区将对基因的表达活性有最大程度地促进作用,而H3K4Me2发生在基因转录区才具有一定的促进基因表达的作用。作者也分析了三种组织特异性修饰与基因组织特异性表达的关系。在对非编码RNA的分析中发现,不同组织间的ncRNA也具有特异的修饰模式。因为本实验是第一次将三种功能上相反的基因组修饰综合在一起研究的,因此发现很多基因同时具有一种以上的修饰,由于三种修饰的作用结果都是不一样的,谁在修饰中占有主导地位,以及三种修饰是如何相互作用,相互转变的都是未知的。通过对基因共修饰的研究,我提出了“共价修饰竞争模型”(CovalentModification Competition Model),此模型可以合理地解释这三种修饰是如何相互作用,相互竞争,进而调控基因转录活性以及表达水平的高低的。

4.期刊论文严建兵.王毅.汤华.黄益勤.李建生.郑用琏基于株高性状的玉米EST序列与水稻基因组的比较研究-作物学报2004,30(7)

从已公布的玉米分子标记中,挑选出均匀覆盖玉米全基因组、平均间距小于10 cM的224个SSR和RFLP分子标记,从NCBI上查找这些标记所在的玉米EST或基因的原始序列,逐一与水稻数据库的序列信息进行同源性比较.结果表明:在PN<1e-5水平上,从水稻数据库中共找到16 939段同源序列,平均每段玉米的序列可以在水稻数据库中找到75.6段同源序列;在PN<1e-10水平上,一共找到7 853段同源序列,将其中2 729段序列与水稻的物理图谱和分子标记连锁图进行比对定位,最终将896段同源序列整合在水稻分子标记连锁图上,形成了在序列水平上的玉米和水稻的比较基因组图谱.基于这一图谱,对已定位的玉米和水稻株高QTL的分子标记进行了比较基因组的定位分析.10个玉米株高QTL紧密连锁的18个分子标记中有10个标记在与之同源的水稻染色体区域也定位了控制水稻株高的QTL或基因,暗示有相当一部分控制玉米和水稻株高的QTL是同源的.但进一步的分析表明,玉米与水稻基因组的连续共线性区域可能低于预期估计;在此基础上提出了一种利用水稻基因组数据进行禾本科植物比较基因组,发掘新分子标记和克隆大基因组植物基因的策略.

5.学位论文田相军水稻线粒体基因组——序列多态性和基因组进化,以及线粒体、叶绿体和细胞核基因组间的基因迁移2006

水稻是世界上最重要的粮食作物,全球半数以上的人口以其为主食。因其具有特殊的生理生化特征和作为人类粮食作物的经济学意义,一直以来是基因组计划——高等植物基因组测序计划中的重要模式生物之一。自2000年以来,中科院北京基因组研究所采用全基因组霰弹(Shot-Gun)法测序,完成了中国超级杂交水稻亲本(93-11和PA64S)的全基因组序列“工作框架图”和基因“精细图”。在此基础上,我们对该两种水稻的线粒体基因组进行了序列完成图的组装,并分析了它们之间的序列多态性,基因组的进化,以及线粒体、叶绿体和细胞核基因组间的基因迁移。

(一)利用水稻全基因组测序序列中高质量的对线粒体基因组有着高覆盖度的线粒体基因组相关序列,我们完成了两种水稻的线粒体全基因组序列的组装,其中93-11是籼稻品种,PA64S是具有粳稻母本起源的籼型不育系品种,它们分别为中国超级杂交水稻两优培九(LYP9)的父本和母本;又利用Syngenta公司公布的水稻全基因组测序数据,我们完成了粳稻品种Nipponbare线粒体全基因组序列的组装。在基因组序列分析上,我们把水稻不同亚种水稻间的线粒体基因组序列多态性称为“亚种间差异”(intersubspecificvariations);把水稻个体内线粒体基因组序列的多态性称为“种内差异(intravaritalvariations)”。该研究中,我们在水稻线粒体“亚种间差异”位点上确定了96个单核苷酸多态性(singlenucleotidepolymorphism,SNP)位点、25个插入和缺失(insertionanddeletion,InDel)突变位点,和3个片段序列差异(segmentalsequencevariation,SSV)位点。从这些差异中我们选择了一些可以区别籼稻和粳稻的标记性位点,并在不同的水稻品种中做了广泛的实验验证。“亚种间差异”的数据表明线粒体基因组中单核苷酸多态性的平均发生率是0.02%,插入和缺失突变的平均发生率是0.006%,该两类序列多态性的平均发生频率分别为叶绿体基因组的2/5和1/3,为细胞核基因组的1/21和1/38。利用“亚种间差异”的单核苷酸多态性位点在基因组中发生的频率,我们估算了籼稻和粳稻线粒体基因组的分化时间大概是在9万到50万年以前。在93-11和PA64S两个个体中,“种内差异”的数据表明它们的线粒体基因组中单核苷酸多态性的平均发生率分别是1.26%和1.38%,插入和缺失平均发生率分别是1.13%和1.09%。对种内单核苷酸多态性位点两侧的核苷酸出现的频率进行分析,我们发现,发生单核苷酸突变的位点两侧的核苷酸有着明显的选择性偏好,特别是5’-端和3’-端紧挨突变位点上的核苷酸,它们存在非常明显的偏好性选择。

(二)基因序列从细胞器(线粒体和叶绿体)基因组到细胞核基因组,以及在细胞器基因组间的迁移,并在新基因组内进行重新组合是高等植物中普遍存在的现象。在这一现象中,遗传物质从一个基因组到另一个基因组的迁移是有选择性的,这主要是由于细胞器和细胞核基因组内的DNA复制和修复系统存在不兼容性而引起的。通过对水稻93-11的细胞核、线粒体和叶绿体基因组中tRNA的检测和比较,我们得到如下结果(1)线粒体中有15个tRNA基因起源于叶绿体;(2)细胞核中有43个tRNA基因与线粒体tNRA基因相似,有80个tRNA基因与叶绿体tRNA基因相似;(3)细胞核中有32个tRNA基因同时与线粒体和叶绿体tRNA基因相似;(4)细胞核基因组中类似于线粒体和叶绿体的tRNA基因可以组成一套完整的tRNA来运输所必须的21种氨基酸。这些自细胞器中迁移过来的细胞核tRNA基因中有超过97%的基因在细胞核基因组内坐落在比较长的与该细胞器基因组相似的序列上(如该基因有大于20bp的侧链细胞器序列),也有接近40%的tRNA基因与其它的两个或者更多个细胞器tRNA基因形成基因簇位于细胞核染色体上。同样,线粒体中有着叶绿体起源的12个tRNA基因都有5’端和3’端大于20bp的侧链叶绿体序列,并且这些基因间有着非常高的序列相似性。对发生迁移的tRNA基因以及它们的起源基因组中的同类基因进行系统进化分析,我们发现高等植物细胞内基因组间的tRNA基因的迁移是一个持续并正在进行的过程,并且是一个有着基因选择性和插入位点选择性的非随机过程。

6.期刊论文樊龙江.郭兴益.FAN Long-jiang.GUO Xing-yi从水稻基因组序列中挖掘生物信息-浙江大学学报(农业与生命科学版)

2005,31(4)

重点介绍了在水稻基因组序列分析方面取得的几项最新研究结果.内容主要包括:水稻基因组被证实曾发生过全基因组倍增;水稻基因组大小变化的趋势;水稻籼粳亚种的分化时间比以前估计的100万年前要迟得多;对水稻基因产生GC含量负梯度现象的解释.

7.学位论文王希胤确定染色体同源片段的统计与计算方法及其在水稻和拟南芥基因组中的应用2005

确定染色体同源片段是基因组学研究的一个重要方面,有助于揭示基因组在历史上发生的多种多样的进化事件,如DNA复制、染色体重排、基因丢失等。研究发现,谷物之间、哺乳动物之间、分属不同种的酵母之间都存在大规模的染色体同源片段;物种内部也常发现由于大规模基因组复制而形成的同源片段;约80%的拟南芥基因组处于复制区,分析表明,拟南芥的进化过程中,至少发生了一次或三次多倍化事件。

水稻基因组中也发现了许多大的复制片段,但对于这些复制片段的规模、复制事件的性质和发生时间,存在很大分歧。基于粳稻基因组草图数据分析,Goff等推测四千到五千万年前发生了一次多倍化事件。而VandePeer等发现仅15%基因位于复制区,而且大部分与水稻2号染色体相关,因此认为水稻在历史上只有一、两条染色体发生了复制,从而有一个非整倍体祖先,并推断相应非整倍化事件发生在七千万年前;尽管后来他们找到了较多复制片段,但依然维持已有结论。几乎在同时而且同样基于粳稻基因组数据,Paterson等利用不同方法发现61.9%水稻基因位于复制区,远多于VandePeer等的发现;他们认为这可能源于约七千万年前一次多倍化事件。

这种争议主要在于是多倍化还是非整倍化,也就是复制发生的规模,这可能是由于采用的方法不同造成的。实际上,大规模复制之后,由于大量染色体重排、基因丢失、基因插入等,使染色体片段间同源关系变得面目全非,从现存的遗迹识别同源性并相当困难。目前,已有多种推断染色体间同源关系的方法,或基于遗传图谱、或基于序列比较、或基于基因共群性(synteny)、或基于基因共线性(colinearity),等等。基于共线性的方法有很多优点,由于考虑了基因顺序和密度,所确定的同源片段较为可靠,而且运算效率较高。

VandePeer等发展了名为ADHoRe的共线性方法,并用于水稻基因组分析。然而,现有共线性方法有一些缺陷,最大问题在于参数选择基于经验,没有深入合理的理论分析。例如,相邻同源基因对之间的距离是一个重要参数,经验方法难以取定一个合适的值,而把不适当的值用于寻找同源区域,会使结果严重地偏离实际情况。

本文发展了一个新的基于共线性的确定同源片段方法,其主要特点是:合理的统计推断、较强的适应性、计算的高效性。该方法的参数选择,尤其是相邻同源基因对距离确定

,依据基因组特点做了合理的理论分析,对推断的同源区显著性也做了深入的统计学检验。本文开发了一个新的动态规划算法并编写了程序ColinearScan实现这个共线性方法。

利用ColinearScan分析370Mb水稻籼稻亚种基因组序列,发现337个复制片段涉及全部12条染色体的76%水稻基因位于这些复制区。基于上述结果,以及对共线性基因系统发育学分析,本文推断在七千万年前,水稻祖先发生了一次全基因组复制,即多倍化事件。本文支持Paterson等的结论,而与VandePeer等的结论不一致。根据分析,我们认为VandePeer等所得结论与Paterson和本文研究结果不一致的原因在于不适当的参数选择以及过于严格的线性回归分析方法。解决这个分歧的意义在于,确定了一次发生于主要的谷物,如玉米、小麦、大麦、高粱、谷子、甘蔗等,分化之前的多倍化事件,这个多倍化影响了这些人类赖以生存的主要作物的基因组结构。本文研究结果得到了Paterson和VandePeer小组的高度评价,后者在发表于NewPhytologist的评述文章中,承认其分析存在问题,并重做了水稻基因组分析,得到了和笔者的工作相近的结果(见附录)。

基于水稻基因组复制图样和水稻与高粱的比较基因组图谱,本文重构了两个物种的染色体结构进化图谱,推断谷物的共同祖先在多倍化发生之前有6条染色体。这对研究谷物染色体进化有重要意义。

另外,本文还确定了拟南芥基因组中的复制片段,发现约82.6%的拟南芥基因组处于复制区,而且这些复制区常常是多拷贝的。按照这个发现,本文支持拟南芥基因组曾经发生三次多倍化的可能性。本文还全面分析和确定了水稻和拟南芥之间的染色体同源片段,这些具有共线性基因的同源片段覆盖水稻和拟南芥基因组的61.25%和87.35%;然而,几乎所有这些片段长度都小3Mb,所以很难建构单、双子中植物之间可用于基因定位信息共享的比较遗传图谱。

8.期刊论文杨宇.陈瑞阳水稻基因组测序的研究进展-遗传2001,23(6)

水稻是最重要的粮食作物之一,世界上大约有一半的人口以水稻为主要粮食.作为基因组研究的模式植物,水稻基因组的测序工作已在世界范围内展开.此项研究工作不仅能破译水稻全基因组序列,还将有助于了解其他禾本科植物的基因组信息.本文对水稻基因组测序工作进展作一综述.

9.学位论文陈双燕T-DNA标签在水稻基因组中的分布与特征2003

该研究利用T-DNA作为插入标签,构建水稻突变体材料,利用TAIL-PCR方法获得T-DNA插入旁邻序列,通过生物信息学分析将1009个T-DNA标签在水稻基因组中的分布规律及T-DNA整合位点的特征.主要研究结果如下:1.利用农杆菌转化水稻品种日本晴和中花11,共得到了约2000株存活的阳性转基因植株.利用TAIL-PCR方法,使用3个简并引物,分析了2000份转化植株的基因组DNA,共得到了1631条T-DNA旁邻序列,TAIL-PCR产物的最终得率为80﹪左右.2.1009个T-DNA旁邻序列在水稻12条染色体上的定位结果表明T-DNA在水稻染色体上并不是随机分布的,其分布模式与EST的分布比较一致,说明T-DNA偏好插在水稻的基因富含区. T-DNA在大多数染色体臂的末端分布较多而在着丝粒的周缘区域分布较少.第4染色体的短臂和长臂的着丝粒周缘区域都很少有T-DNA的分布. T-DNA在第1、2和3号染色体上的分布密度相对较高,大约是第11和12号染色体的2倍,占到所有定位的T-DNA标签的48﹪.3. T-DNA在水稻基因区、基因间隔区及重复DNA区的分布结果表明只有2.4﹪的T-DNA插在重复DNA区. T-DNA在基因区和基因间隔区的插入分布频率(58.1﹪和41.9﹪)与预测的基因区的基因间隔区在水稻基因组中所占的比例(57.8﹪和42.2﹪)比较一致.分析T-DNA在染色体1上的分布也得出了同样的结论,同时发现T-DNA在内含子中的插入密度是外显子中的2倍多,说明T-DNA偏好插入内含子.该研究还表明T-DNA在水稻基因中的分布是随机的,对于基因的5′端或3′端没有明显的偏好.4.分析T-DNA插入位点附近染色体序列的AT含量表明T-DNA插入位点对于AT碱基对并没有明显的偏好.分析了233个T-DNA左边界和190个T-DNA右边界与水稻基因组交接位点的序列,结果表明T-DNA在整合过程中不仅伴随着左右喧界序列的缺失及“filler DNA”的插入,而且还以单拷贝或多拷贝的形式插入在基因组中的同一个位点.从缺刻位置开始,大部分左边界的缺失少于35bp,大多数的右边界序列缺失为21bp. “filler DNA”的长度从几个bp

到300 bp 左右,其来源是T-DNA或基因组序列,在单拷贝的T-DNA左右边界或两个重复的T-DNA中间都会有“filler DNA”的插入. T-DNA整合的复杂结构用DSBR模型比较容易解释.

10.学位论文彭贵子水稻基因组重复基因进化2006

基因重复研究是生物进化研究的热点问题。它与生物体基因组大小的进化、新基因的起源、物种的分化以及基因抗突变的能力大小等都密切相关。水稻(Oryza sativa L.)是最重要粮食作物之一,其基因组也是禾谷类作物中最小的,且易于遗传操作并与其他禾本科作物存在共线性关系,目前已成为遗传学和基因组研究的模式植物。因此,水稻全基因组基因重复的研究对探索水稻及其近源物种的起源、分化以及各自基因组中不同基因家系的不同进化方式的研究都将十分有意义。虽然对水稻全基因组基因重复的研究已有报道,但由于数据库拼接错误、转座子基因(TE)的处理不当、对大于2个基因的基因家族的组合的方式计算错误等不足,十分有必要重新对水稻全基因组重复基因进行更系统、更合理的研究,以期建立一套重复基因研究的标准化处理方法和建立一套完整的水稻全基因组的基因重复研究平台,为系统的研究基因组中不同功能的基因家系的进化方式打下坚实的基础。

本文以TIGR中水稻Nipponbare最新注释数据库(2005年5月)为基础,通过基因家族的鉴别,严格的TE和重复序列(repeat)的除去,基因排序与遗传参数的计算等,对整个水稻基因组范围内基因重复进行了系统研究,得出如下几点结论:1) 水稻中存在大量的大片断基因重复、串连基因重复和分散式基因重复,它们对水稻基因组进化产生重大的影响;2) 大片断基因重复区域占全基因组的59%,所包含区域基因占全部基因的77%,但区域内已经丢失的基因占87.2%,说明了水稻大片断基因重复普遍性与重复基因的高丢失率;3) 证实水稻大片断基因重复的产生是一个爆发性的事件而串连基因重复和分散式基因重复的产生的速度则相对恒定连续的过程;4) 第一次用数值的形式估算大片断重复基因产生初期的选择作用对其进化的影响,从实验结果中可知其产生的初期

选择作用对进化的作用非常的微弱;5) 根据实验数据对水稻染色体的进化模式提出了一个可能的进化方式和假设,对今后研究水稻染色体的进化研究具有一定的参考价值。

引证文献(5条)

1.张文银.杨生明水稻基因工程育种现状及其展望[期刊论文]-宁夏农林科技 2008(6)

2.张文银.安永平.王彩芬.马静水稻生物技术育种现状及其展望[期刊论文]-种子 2008(11)

3.张文银.安永平.王彩芬.马静主要转基因作物研究现状及其产业化进展[期刊论文]-生物技术通报 2008(5)

4.黄碧光.范永立.刘美顺籼稻品种93-11遗传转化中抗生素适宜剂量的筛选[期刊论文]-福建农林大学学报(自然科学版) 2007(4)

5.张淑红.姜涛辽宁省水稻品质现状与改进措施[期刊论文]-北方水稻 2007(3)

本文链接:https://www.sodocs.net/doc/119731298.html,/Periodical_ycxb200608001.aspx

授权使用:沈阳农业大学(syny),授权号:bdbb32a3-a6fc-4942-b2c6-9e0000ba199b

下载时间:2010年9月29日

水稻基因组学的的研究进展

基因组学课程论文 所在学院生命科学技术学院 专业14级生物技术(植物方向) 姓名金祥栋 学号2014193012

水稻基因组学的研究进展 摘要:随着模式植物——拟南芥和水稻基因组测序的完成,近年来关于植物基因组学的研究越来越多。水稻是世界上重要的粮食作物之一,养活着全世界近一半的人口。同时南于水稻基冈组较小、易于转化及与其他禾本科植物基因组的同线性和共线性等特点,一直被作为禾本科植物基因组研究的模式作物。水稻基因组测序的完成及种质资源的基因组重测序,为水稻功能基因组研究奠定了基础。现综述我国水稻基因组测序和功能基因组研究历史,重点介绍了近年来在水稻基因组序列分析中获得的几项最新的研究结果。 关键词:水稻;基因组测序;功能基因组;研究历史;基因组学;研究进展 The recent progress in rice genomics research Abstract: With the completion of genome sequencing ofthe model plant-- Arabidopsis and rice,more and more researches on plant genomics emerge in recent years. Rice i s one of the most important crops in the world, raised nearly half of the world popul ation. At the same time in south rice Keegan group is smaller, with linear and linear features such as easy transformation and other gramineous plant genome, has been use d as a model crop for plant genome research of Gramineae. Genome sequencing and germplasm resources the rice genome sequencing completed laid the foundation for ric e functional genomics research. This article reviews the history and function of our ge nome sequencing of rice genome research, introduces several latest research results in recent years in the analysis of rice genome sequences. 前言 基因组是1924年提出用于描述生物的全部基因和染色体组成的概念,是研究生物基因结构与功能的学科,是在遗传学的基础上发展起来的一门现代生物技术前沿科学,也是现代分子生物学和遗传工程技术所必要学科,是当今生物学研究领域最热门、最有生命力、发展最快的前沿科学之一。基因组学的主要任务是研究探索生物基因结构与功能,生物遗传和物理图谱构建,建立和发展生物信息技术,为生物遗传改良及遗传病的防治提供相关技术依据。 进入21 世纪,随着全球化、市场化农业产业发展和全球贸易一体化格局的逐步形成,我国种业正面临前所未有的严峻挑战,主要表现在:依靠传统育种技术难以大幅度提高粮食单产;土地资源短缺,农业环境污染日益突出;种质资源发掘、基因组育种技术亟需创新等。水稻不仅是重要的粮食作物,由于其基因组较小且与其他禾本科作物基因组存在共线性,以及具有成熟高效的遗传转化体系,已成为作物功能基因组研究的模式植物。因此,水稻基因组研究对发展现代农作物育种技术、提升种业国际竞争力和保障粮食有效供给具有重大战略意义。 基因组研究主要包括三个层次:①结构基因组学,以全序列测序为目标,构建高分辨率的以染色体重组交换为基础的遗传图谱和以DNA 的核苷酸序列为基础的物理图谱。②功能

植物数量性状全基因组选择研究进展

4期吴永升等:植物数量性状全基因组选择研究进展1511 全基因组选择的概念和原理 全基因组选择(Genome-wideselection,GWS),又称基因组选择(Genomicselection,GS),由Meu—wissen于2001年首先提出∞J。主要是通过全基因组中大量的分子标记和参照群体(trainingpopula—tion)的表型数据建立BLUP模型估计出每一标记的育种值,然后仅利用同样的分子标记估计出后代个体育种值并进行选择[7】。 全基因组选择理论主要利用连锁不平衡信息,即假设标记与其相邻的QTL处于连锁不平衡状态,因而由相同标记估计的不同群体的染色体片段效应是相同的,这就要求标记密度足够高以使所有的QTL与标记处于连锁不平衡(LD)状态哺J。而目前随着拟南芥、水稻、玉米等植物基因组序列图谱及SNP图谱的完成或即将完成,提供了大量的SNP标记用于基因组研究。而随着SNP芯片等大规模高通量SNP检测技术的发展和成本的降低,使得全基因组选择应用成为可能。 2全基因组选择的基本方法及案例说明 2.1全基因组选择的基本方法 全基因组选择在实施过程中应该包括以下几个基本步骤:在需要实行选择的参照群体中获取参照群体的基因型数据和表现型数据;然后,通过BLUP程序估计出每个标记位点的标记效应值,从而获得育种值;最后,在接下来每一轮的选择中,不再需要表型数据,根据每一轮次群体基因型信息估计育种值,直接选择群体的优良单株【9j。 全基因组选择的核心过程就是用从参照群体中每一个体的表现型数据和基因型数据建立的数学模型来估算接下来的育种群体中仅有基因型数据的个体的GEBV值。由既有表现型数据又有基因型数据的每一个体组成的群体被成为参照群体。参照群体用来估计数学模型的参数,这个参数接着用来计算仅有基因型数据的育种个体GEBV值,然后根据计算的GEBV值对育种群体进行选择并提升到下一轮次的选择中。因此,通过模型来预测个体的育种值,可以不进行表型鉴定就直接对育种群体的个体进行选择(Meuvissen,2001)。为了使估算的GEBV值尽可能地准确,参照群体必须具有代表性,尽可能地代表接下来在育种过程中用全基因组选择方法来进行选择的分离群体。 2.2全基因组选择方法案例 如图l所示,在这个例子中,笔者的目标是把外来种质中的优良性状基因(包括产量、矮杆、抗逆等)导入本地优良的自交系,从而实现种质的改良 图1在玉米中利用全基因组选择方法导入外源种质 Fig.1Genomewideselectionto introgr%exotictraitsintoadaptedmaize

全基因组关联分析的原理和方法

全基因组关联分析(Genome-wide association study;GWAS)是应用基因组中 数以百万计的单核苷酸多态性(single nucleotide ploymorphism ,SNP)为分子 遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略。 随着基因组学研究以及基因芯片技术的发展,人们已通过GWAS方法发现并鉴定了大量与复杂性状相关联的遗传变异。近年来,这种方法在农业动物重要经济性状主效基因的筛查和鉴定中得到了应用。 全基因组关联方法首先在人类医学领域的研究中得到了极大的重视和应用,尤其是其在复杂疾病研究领域中的应用,使许多重要的复杂疾病的研究取得了突破性进展,因而,全基因组关联分析研究方法的设计原理得到重视。 人类的疾病分为单基因疾病和复杂性疾病。单基因疾病是指由于单个基因的突变导致的疾病,通过家系连锁分析的定位克隆方法,人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因,这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量,从而产生了符合孟德尔遗传方式的疾病表型。复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有439 个。全基因组关联分析技术的重大革新及其应用,极大地推动了基因组医学的发展。(2005年, Science 杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动, 此后一系列GWAS陆续展开。2006 年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的GWAS结果(Herbert 等. 2006);2007 年, Saxena 等多个研究组联合报道了与2 型糖尿病( T2D ) 关联的多个位点, Samani 等则发表了冠心病GWAS结果( Samani 等. 2007); 2008 年, Barrett 等通过GWAS发现了30 个与克罗恩病( Crohns ' disrease) 相关的易感位点; 2009 年, W e is s 等通过GWAS发现了与具有高度遗传性的神经发育疾病——自闭症关联的染色体区域。我国学者则通过对12 000 多名汉族系统性红斑狼疮患者以及健康对照者的GWAS发现了5 个红斑狼疮易感基因, 并确定了4 个新的易感位点( Han 等. 2009) 。截至2009 年10 月, 已经陆续报道了关于人类身高、体重、 血压等主要性状, 以及视网膜黄斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖症、糖尿病、精神分 裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的GWAS结果, 累计发表了近万篇 论文, 确定了一系列疾病发病的致病基因、相关基因、易感区域和SNP变异。) 标记基因的选择: 1)Hap Map是展示人类常见遗传变异的一个图谱, 第1 阶段完成后提供了 4 个人类种族[ Yoruban ,Northern and Western European , and Asian ( Chinese and Japanese) ] 共269 个个体基因组, 超过100 万个SNP( 约1

基因组重测序

基因组重测序 背景介绍 全基因组重测序,是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。与已知序列比对,寻找单核苷酸多态性位点(SNP )、插入缺失位点(InDel ,Insertion/Deletion )、结构变异位点(SV ,Structure Variation )位点及拷贝数变化(CNV) 。 可以寻找到大量基因差异,实现遗传进化分析及重要性状候选基因的预测。涉 及临床医药研究、群体遗传学研究、关联分析、进化分析等众多应用领域。 随着测序成本的大幅度降低以及测序效率的数量级提升, 全基因组重测序已经成为研究人类疾病及动植物分子育种最为快速有效的方法之一。利用illumina Hiseq 2000 平台,将不同插入片段文库和双末端测序相结合,可以高效地挖掘基因序列差异和结构变异等信息, 为客户进行疾病研究、分子育种等提供准确依据。 重测序的两个条件:(1)该物种基因组序列已知;(2)所测序群体之间遗传性差异不大( >99% 相似度 ) 在已经完成的全基因组测序及其基因功能注释的基础上,采用全基因组鸟枪法(WGS )对DNA 插入片段进行双末端测序。 技术路线 生物信息学分析

送样要求 1.样品总量:每次样品制备需要大于5ug 的样品。为保证实验质量及延续性,请一次性提供至少20ug的样品。如需多次制备样品,按照制备次数计算样品总量。 2.样品纯度:OD值260/280应在1.8~2.0 之间;无蛋白质、RNA或肉眼可见杂质污染。 3.样品浓度:不低于50 ng/μL。 4.样品质量:基因组完整、无降解,电泳结果基因组DNA主带应在λ‐Hind III digest 最大条带23 Kb以上且主带清晰,无弥散。 5.样品保存:限选择干粉、酒精、TE buffer或超纯水一种,请在样品信息单中注明。 6.样品运输:样品请置于1.5 ml管中,做好标记,使用封口膜封好;基因组DNA如果用乙醇沉淀,可以常温运输;否则建议使用干冰或冰袋运输,并选择较快的运输方式。 提供结果 根据客户需求,提供不同深度的信息分析结果。

已完成基因组测序的生物(植物部分)分析解析

水稻、玉米、大豆、甘蓝、白菜、高粱、黄瓜、西瓜、马铃薯、番茄、拟南芥、杨树、麻风树、苹果、桃、葡萄、花生 拟南芥籼稻粳稻葡萄番木瓜高粱黄瓜玉米栽培大豆苹果蓖麻野草莓马铃薯白菜野生番茄番茄梨甜瓜香蕉亚麻大麦普通小麦西瓜甜橙陆地棉梅毛竹桃芝麻杨树麻风树卷柏狗尾草属花生甘蓝 物种基因组大小和开放阅读框文献 Sesamum indicum L. Sesame 芝麻(2n = 26)293.7 Mb, 10,656 orfs 1 Oryza brachyantha短药野生稻261 Mb, 32,038 orfs 2 Chondrus crispus Red seaweed爱尔兰海藻105 Mb, 9,606 orfs 3 Pyropia yezoensis susabi-nori海苔43 Mb, 10,327 orfs 4 Prunus persica Peach 桃226.6 of 265 Mb 27,852 orfs 5 Aegilops tauschii 山羊草(DD)4.23 Gb (97% of the 4.36), 43,150 orfs 6 Triticum urartu 乌拉尔图小麦(AA)4.66 Gb (94.3 % of 4.94 Gb, 34,879 orfs 7 moso bamboo (Phyllostachys heterocycla) 毛竹2.05 Gb (95%) 31,987 orfs 8 Cicer arietinum Chickpea鹰嘴豆~738-Mb,28,269 orfs 9 520 Mb (70% of 740 Mb), 27,571 orfs 10 Prunus mume 梅280 Mb, 31,390 orfs 11 Gossypium hirsutum L.陆地棉2.425 Gb 12 Gossypium hirsutum L. 雷蒙德氏棉761.8?Mb 13 Citrus sinensis甜橙87.3% of ~367 Mb, 29,445 orfs 14 甜橙367 Mb 15 Citrullus lanatus watermelon 西瓜353.5 of ~425 Mb (83.2%) 23,440 orfs 16 Betula nana dwarf birch,矮桦450 Mb 17

全基因组重测序数据分析

全基因组重测序数据分析 1. 简介(Introduction) 通过高通量测序识别发现de novo的somatic和germ line 突变,结构变异-SNV,包括重排 突变(deletioin, duplication 以及copy number variation)以及SNP的座位;针对重排突变和SNP的功能性进行综合分析;我们将分析基因功能(包括miRNA),重组率(Recombination)情况,杂合性缺失(LOH)以及进化选择与mutation之间的关系;以及这些关系将怎样使 得在disease(cancer)genome中的mutation产生对应的易感机制和功能。我们将在基因组 学以及比较基因组学,群体遗传学综合层面上深入探索疾病基因组和癌症基因组。 实验设计与样本 (1)Case-Control 对照组设计; (2)家庭成员组设计:父母-子女组(4人、3人组或多人); 初级数据分析 1.数据量产出:总碱基数量、Total Mapping Reads、Uniquely Mapping Reads统计,测序深度分析。 2.一致性序列组装:与参考基因组序列(Reference genome sequence)的比对分析,利用贝叶斯统计模型检测出每个碱基位点的最大可能性基因型,并组装出该个体基因组的一致序列。3.SNP检测及在基因组中的分布:提取全基因组中所有多态性位点,结合质量值、测序深度、重复性等因素作进一步的过滤筛选,最终得到可信度高的SNP数据集。并根据参考基 因组信息对检测到的变异进行注释。 4.InDel检测及在基因组的分布: 在进行mapping的过程中,进行容gap的比对并检测可信的short InDel。在检测过程中,gap的长度为1~5个碱基。对于每个InDel的检测,至少需 要3个Paired-End序列的支持。 5.Structure Variation检测及在基因组中的分布: 能够检测到的结构变异类型主要有:插入、缺失、复制、倒位、易位等。根据测序个体序列与参考基因组序列比对分析结果,检测全基因组水平的结构变异并对检测到的变异进行注释。

水稻基因组进化的研究进展

水稻基因组进化的研究进展 水稻是世界上重要的粮食作物之一,养活着全世界近一半的人口。同时南于水稻基冈组较小、易于转化及与其他禾本科植物基因组的同线性和共线性等特点,一直被作为禾本科植物基因组研究的模式作物。水稻是第一个被全基因组测序的作物,目前栽培稻2个亚种全基因组测序工作已经完成:粳稻品种日本晴(Nipponbare)通过全基因组鸟枪法和逐步克隆法被测序,籼稻品种扬稻6号(9311)通过全基因组鸟枪法被测序。除核基因组外,水稻叶绿体和线粒体基因组也于1989年和2002年分别被测序。水稻2个亚种的全基因组测序完成,一方面开启了植物比较基因组学的大门,另一方面为人们在基冈组水平上鉴定出所有水稻基因并分析其功能奠定了基础,同时也使得人们对植物进化的认识,尤其是对禾本科植物进化的了解,逐步从系统分类和分子标记水平进入到了基因组序列水平。许多研究者通过对水稻基因组序列的分析,利用生物信息学工具,对水稻在基因组水平上的进化进行了大量研究。 1 水稻及其他禾本科植物基因组的古多倍体化过程 水稻是典型的二倍体植物,其核基因组中共有12条染色体。在水稻基因组被完整测序之前,人们就已经采用分子标记、DNA重复元件等方法探究水稻基因组的古多倍体化(polyploidization)过程,并发现了一些重复的染色体片段。随着水稻基因组测序计划的完成,越来越多的证据表明水稻基因组曾发生过全基因组复制(whole genome duplication),即古多倍体化过程。 Golf等利用鸟枪法完成了粳稻品种日本晴全基因组的测序工作,并利用同义替换率分布方法(Ks- based age distribution)提出水稻基因组可能发生过一次全基因组复制过程。此后多家研究机构和一些研究者对水稻基因组中的重复片段进行了研究,虽然得出的结论不尽相同,但均发现水稻基因组中存在大量的重复片段。根据所采用方法和参数的不同,这些重复片段占整个水稻基因组的15%~62%。Yu 等在水稻基因组中发现了18对大的重复片段,大约占整个基因组的65.7%。其中17对重复片段形成的时间很相近,发生在禾本科物种分化之前;最近的一次片段复制事件发生在水稻11和12号染色体之间,在禾本科物种分化之后。 水稻基因组被测序之后,许多科研机构对基因组数据进行了详尽的注释。其中应用比较广泛的是美国基因组研究院(the institute for genome research,TIGR)和日本农业生物科学研究所(national in- stitute of agrobiological sciences,NIAS)的水稻基因组注释信息。TIGR根据其注释的结果和基因相似性矩阵(gene homology matrix,GHM)方法,检测到大量染色体间的重复片段,这些重复片段几乎覆盖了整个水稻基因组。TIGR水稻基因组注释数据库从第4版开始便增加了对片段重复的注释,该分析是利用DAGChainer程序进行的,重复片段采用100 kb和500 kb 2种参数模型进行了染色体片段的基因共线性分析(图1),这是全基因组复制的有力证据。根据复制片段上同源基因的分子进化分析,估计全基因组复制发生在大约7 000万年前,在禾本科物种分化之前。此外,Zhang等利用TIGR更新的数据进行分析,采用同义替换率分布方法检测到另一次更古老的(单、双子叶植物分化前)基因组复制事件,说明水稻基因组至少经历了2次全基因组复制过程。 全基因组复制或多倍体化是植物尤其是禾本科作物物种形成和进化过程中非常重要的事件,大部分开花植物在进化过程中均经历了多倍体化过程。基因组加倍后,再经历所谓的二倍体化过程(diploidization),进化成当代的二倍体物种,并造成大量重复片段中基因的重排和丢失。Salse等研究发现基因组复制事件对禾本科植物的物种形成和演变具有重要作用。他们认为禾本科植物的祖先物种是一个基因组内包含5条染色体的物种,在进化过程中,首先在距今5 000~7 000万年前经基因组复制产生了10条染色体;此后,在基因组内发生了2次染色体置换和融合而形成了12条中间态染色体。以这12条中间态染色体为基础,逐渐分化出水稻、小麦、玉米和高粱的基因组,其中水稻基因组保留了原有的12条中间态染色体,而小麦、玉米和高粱均又发生了染色体丢失和融合才形成了现有的基因组。水稻全基因组复制片段是至今为止在动、植物基因组中发现的最为清晰、完整的基因组复制的遗迹。水稻之所以保存这么完整,一方面是水稻基因组保持了12条中间态染色体的基本形态,另一方面可能与水稻基因组相对较稳定有关。 2水稻籼粳2个亚种的分化 水稻是世界上最重要的粮食作物之一,在其11 500多年的栽培历史中,因适应不同的农业生态环境而产生了丰富的遗传多样性和明显的遗传分化。长期以来,基于形态性状、同工酶以及对一些化合物不同反应的研究,把亚洲栽培稻(Oryza sativa L.)分为籼稻(indica)和粳稻(japonica)2个亚种。其中籼亚种耐湿耐热,主要适应于热带和亚热带等低纬度地区,而粳亚种则耐寒耐弱光,适应于高纬度和高海拔地区种植。这2个亚种间不仅产生了生殖隔离的基因库,还在形态特征、农艺性状和生理生化反应等方面存在明显的差异。近期群体

植物基因组测序

千年基因将应邀参加第十六届全国植物基因组学大会 第十六届全国植物基因组学大会将于2015年8月19日-22日在陕西杨凌召开,千年基因应邀参加此次会议,并将在会场学术交流区设立展台。届时千年基因的技术团队会向大家展示我们最全面的测序平台、一站式的基因组学解决方案以及近年来在植物基因组学领域取得的科研成果,欢迎广大科研人员莅临指导交流! 在测序平台方面,千年基因目前拥有国内最全面的测序平台,能够为科研人员提供一站式解决方案。以PacBio RS II三代平台为例,千年基因自去年提供PacBio RS II测序以来,通过项目经验的积累及严格的质量控制,目前各项数据指标已达国内最高水平。数据产出已稳步升级至1.4Gb/ SMRT cell,读长最长可达42 Kb,reads N50高达18Kb,远超PacBio官方提供的数据标准!在植物基因组de novo测序的研究中,千年基因提供的超长读长测序可更好地跨越基因组高重复序列、转座子区域以及大的拷贝数变异区域和结构变异区,从而实现对高杂合及高重复基因组的完美组装。在植物转录组测序的研究中,千年基因提供的超长读长测序无需拼接即可获得全长转录组序列信息,同时可获得全面的可变剪切、融合基因以及Isoform信息。另外,千年基因提供的HiSeq 4000及HiSeq 2000/2500测序可解决研究人员在植物基因组重测序、转录组测序、小RNA测序等方面的科研需求。 在项目经验方面,千年基因与来自全球的科研人员合作开展了大量植物基因组项目,相关成果已发表于Nature、Nature Genetics、Science等杂志。例如,油棕榈基因组项目在Nature 杂志同时发表两篇文章,辣椒基因组项目的成果发表于Nature Genetics,玉米基因组项目的成果发表于Science。在国外合作方面,千年基因与美国爱荷华州立大学Patrick Schnable教授领导的国际玉米基因组团队合作开展的上万份玉米样本重测序项目也正在进行中;千年基因与国际半干旱热带作物研究所建立长期战略合作关系,正在开展上千份木豆、鹰嘴豆及高粱样本的群体遗传学研究;同时千年基因与华盛顿大学的Evan Eugene Eichler院士及佐治亚大学的Jeffrey Lynn Bennetzen院士也有大量基因组项目合作。在国内合作方面,千年基因与广东省农科院、山东省农科院共同启动的花生基因组项目已全部完成de novo测序及数据挖掘,同时与中国科学院、北京大学、中国农业大学、中国科学技术大学、上海交通大学、

美科学家完成大豆基因组测序

Animal Reproduction,Prague(C),Blackwell Publishing Inc, November23-25 Ptak G.,Tischer M.,Bernabo N.,and Loi P.,2003,Donor-depen-dent developmental competence of oocytes from lambs sub-jected to repeated hormonal stimulation,Biology of Repro-duction,69:278-285 Revel F.,Mermillod P.,Peynot N.,Renard J.P.,and Heyman Y., 1995,Low developmental capacity of in vitro matured and fertilize oocytes from calves compared with that of cows, Journal of Reproduction and Fertility,103:115-120Salkamone D.F.,Damiani P.,Fissore R.A.,Robl J.M.,and Duby R.T.,2001,Biochemical and developmental evidence that ooplasmic maturation of prepubertal bovine oocytes is com-promised,Biology of Reproduction,64:1761-1768 Taneja M.,Bols P.E.J.,van de Velde A.,Ju J.C.,Schreiber D., Tripp M.W.,Levine H.,Echelard Y.,Riesen J.,and Yang X. Z.,2000,Developmental competence of juvenile calf oocytes in vitro and in vivo:Influence of donor animal varia-tion and repeated gonadotropin stimulation1,Biology of Re-production,62:206-213 幼畜繁殖(JIVET)技术在性成熟前奶牛上的应用 Application of Juvenile in intro Embryo Transfer(JIVET)Technology on Prepubertal Dairy Cattle !!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! 美科学家完成大豆基因组测序 US Scientists Sequenced the Genome of Soybean 期待已久的大豆基因组序列终于测通。在2010年1月14日的《Nature》杂志上,公布了由美国农业部、美国能源部联合基因组研究所和普渡大学等多家科研机构联合完成的豆科植物最重要的物种大豆的完整基因组序列草图。 科学家门利用全基因组鸟枪测序法对大豆基因组的1.1GB的序列进行了测序,结合物理图谱和高密度遗传图谱,获得了大豆基因组的序列拼接草图。研究结果表明大豆中有46320个编码蛋白的臆测基因,约78%的臆测基因位于染色体末端,这些基因在数量上不到染色体基因组的一半,但几乎全部发生了遗传重组。大豆基因组的编码蛋白比双子叶模式植物拟南芥多70%,与同为“古老的多倍体”的杨树的基因组大小相似。研究人员推测大豆基因组的复制至少发生了两次,一次大约是在5900万年前,另一次则可能发生在1300万年前,由此引起了整个基因组的高度重复,约75%的基因以多拷贝形式出现。两次复制发生后紧接着出现了基因多样化和基因丢失,大量的染色体发生重排。 毫无疑问,精确的大豆基因组序列图谱将为更多的大豆性状遗传基础的鉴定提供便利,并加快大豆品种改良的步伐。大豆是人类最重要的食用油来源作物,研究人员通过对大豆基因组基因序列的分析,发现了约1110个基因与脂代谢有关,这些基因及其相关通路对大豆油含量有重要的影响,通过对某些基因的修饰和调控,或许可增加大豆的油脂产量。 作者:Courtney H.Wilcox,本刊通讯员 本文引用格式:Courtney Wilcox,2010,美科学家完成大豆基因组测序,农业生物技术学报,18(1):191 信息来源:https://www.sodocs.net/doc/119731298.html,/nature/journal/v463/n7278/full/nature08670.html 191

基因型鉴定 中科院版

1.鼠尾DNA提取 第一天: 1.剪取小鼠尾尖(同样适用于脚趾,胚胎组织,卵黄膜等,若不立即提取,可以 放置4℃数日)放入1.5ml EP 管。 2.每管加入鼠尾裂解液 350ul +10ul 蛋白酶K(简称PK,10mg/ml,现用现加)。 3.55℃水浴消化过夜 第二天: 4.用劲将消化好的组织摇匀(可用振荡器摇匀)。 5.每管加入350ul 酚/氯仿(苯酚:氯仿:异戊醇25:24:1,事先配好,4℃保 存)。 6.上下充分混匀,室温静置3分钟后,离心,12000转,30分钟。 7.取出离心后的EP管,可见液体分为三层,取上层无色水相液体约200μl于新 1.5ml EP管中,注意勿吸取中层液体。(不能将中间的蛋白层吸起来,否则会 对后续的实验造成影响。为防止压力过大,可使用切去尖端的枪头)。 8.向新EP管中加入400μl无水乙醇(为2倍于上清的体积),上下颠倒混匀,此 时应可看到白色丝状样的DNA。 9.离心12000转,10分钟。 10.可看到有白色沉淀,弃去上清,加入1ml的75%乙醇,将沉淀弹起,以便去除 DNA上过多的离子。 11.离心,12000转,10分钟。 12.弃去上清,倒置EP管于吸水纸上,室温干燥约15分钟(注意不能过分干燥,以免 基因组DNA难溶解)。 13.加入150-200μl (根据DNA沉淀的量)无菌蒸馏水或者是TE Buffer,可放置37℃助溶。 14.短期4℃,长期-20℃保存。 相关配方: 1.鼠尾裂解液配方 1000ml溶解液中含: 100mM Tris-HCl pH8.5 5mM EDTA 0.2%SDS 200mM NaCl 室温保存。 2.蛋白酶K溶液: 取100mg 蛋白酶K,加去离子水10ml使成10mg/ml,分装后冻存于 -20℃,用时溶解。 3.酚/氯仿: 取Tris平衡酚50ml,氯仿48ml,异戊醇2ml加入100ml棕色试剂瓶中混匀,4℃避光保存。

水稻基因组

第四节基因组分析列举:水稻基因组分析 本节将结合我们近年来的一些研究结果,重点对第一个被基因组测序的作物——水稻的基因组研究和分析结果进行介绍。 水稻是第一个被全基因组测序的作物。亚洲栽培稻(Oryza sativa)共有2个亚种(籼稻和粳稻),其中一个粳稻品种“日本晴”分别通过全基因组鸟枪法(Goff et al, 2002)和逐步克隆方法(Sasaki et al, 2002; Feng et al, 2002; The Rice Chromosome 10 Sequencing Consortium, 2003; The Rice Genome Sequencing Project, 2005)测序,另一个籼稻品种“9311”通过全基因组鸟枪法测序(Yu et al, 2002; Yu et al, 2005)。除了核基因组外,水稻的叶绿体基因组序列早在15年前就已测序完成(Hiratsuka et al, 1989),同时,其线粒体基因组最近也被测序完成(Notsu et al. 2002)。 在获得基因组序列后,一项艰巨的研究任务是如何从巨量的水稻基因组序列中挖掘出潜藏的遗传事件、进化机制等重要生物信息。为此本文结合我们自身的一些研究工作,重点介绍了近年来在水稻基因组序列分析中获得的几项最新的研究结果。 1 现代的二倍体,古老的多倍体 2004年水稻基因组研究的一个重要进展,是获得清晰的证据表明水稻基因组曾发生过全基因组倍增。Paterson等( 2004)、Guyot 等(2004)和我们(Fan et al, 2004;Zhang et al, 2005a)的研究结果也一致表明,在禾本科作物分化前发生过一次全基因组倍增(whole-genome duplication)。早在2002年,根据最初的

全基因组从头测序(de novo测序)

全基因组从头测序(de novo测序) https://www.sodocs.net/doc/119731298.html,/view/351686f19e3143323968936a.html 从头测序即de novo 测序,不需要任何参考序列资料即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的基因组序列图谱。利用全基因组从头测序技术,可以获得动物、植物、细菌、真菌的全基因组序列,从而推进该物种的研究。一个物种基因组序列图谱的完成,意味着这个物种学科和产业的新开端!这也将带动这个物种下游一系列研究的开展。全基因组序列图谱完成后,可以构建该物种的基因组数据库,为该物种的后基因组学研究搭建一个高效的平台;为后续的基因挖掘、功能验证提供DNA序列信息。华大科技利用新一代高通量测序技术,可以高效、低成本地完成所有物种的基因组序列图谱。包括研究内容、案例、技术流程、技术参数等,摘自深圳华大科技网站 https://www.sodocs.net/doc/119731298.html,/service-solutions/ngs/genomics/de-novo-sequencing/ 技术优势: 高通量测序:效率高,成本低;高深度测序:准确率高;全球领先的基因组组装软件:采用华大基因研究院自主研发的SOAPdenovo软件;经验丰富:华大科技已经成功完成上百个物种的全基因组从头测序。 研究内容: 基因组组装■K-mer分析以及基因组大小估计;■基因组杂合模拟(出现杂合时使用); ■初步组装;■GC-Depth分布分析;■测序深 度分析。基因组注释■Repeat注释; ■基因预测;■基因功能注释;■ ncRNA 注释。动植物进化分析■基因家族鉴定(动物TreeFam;植物OrthoMCL);■物种系统发育树构建; ■物种分歧时间估算(需要标定时间信息);■基因组共线性分析; ■全基因组复制分析(动物WGAC;植物WGD)。微生物高级分析 ■基因组圈图;■共线性分析;■基因家族分析; ■CRISPR预测;■基因岛预测(毒力岛); ■前噬菌体预测;■分泌蛋白预测。 熊猫基因组图谱Nature. 2010.463:311-317. 案例描述 大熊猫有21对染色体,基因组大小2.4 Gb,重复序列含量36%,基因2万多个。熊猫基因组图谱是世界上第一个完全采用新一代测序技术完成的基因组图谱,样品取自北京奥运会吉祥物大熊猫“晶晶”。部分研究成果测序分析结果表明,大熊猫不喜欢吃肉主要是因为T1R1基因失活,无法感觉到肉的鲜味。大熊猫基因组仍然具备很高的杂合率,从而推断具有较高的遗传多态性,不会濒于灭绝。研究人员全面掌握了大熊猫的基因资源,对其在分子水平上的保护具有重要意义。 黄瓜基因组图谱黄三文, 李瑞强, 王俊等. Nature Genetics. 2009. 案例描述国际黄瓜基因组计划是由中国农业科学院蔬菜花卉研究所于2007年初发起并组织,并由深圳华大基因研究院承担基因组测序和组装等技术工作。部分研究成果黄瓜基因组是世界上第一个蔬菜作物的基因组图谱。该项目首次将传

科学家完成马铃薯基因组测序

中国科技通讯 中华人民共和国科学技术部 第625期 2011年7月20日 《国家“十二五”科学和技术发展规划》正式发布 科技部会同发改委、财政部、教育部、中科院、工程院、国家自然科学基金会、中国科协、国防科工局等有关部门和单位编制完成的《国家“十二五”科学和技术发展规划》近日正式发布实施。 《规划》提出“十二五”科技发展的总体目标是:自主创新能力大幅提升,科技竞争力和国际影响力显著增强,重点领域核心关键技术取得重大突破,为加快经济发展方式转变提供有力支撑,基本建成功能明确、结构合理、良性互动、运行高效的国家创新体系,国家综合创新能力世界排名由目前第21位上升至前18位,科技进步贡献率力争达到55%,创新型国家建设取得实质性进展。同时,从研发投入强度、原始创新能力、科技与经济结合、科技惠及民生、创新基地建设布局、科技人才队伍建设、体制机制创新等方面提出了具体目标和指标。 《规划》对未来五年我国科技发展和自主创新的战略任务进行了部署,突出以下重点:一是加快实施国家科技重大专项,二是大力培育和发展战略性新兴产业,三是推进重点领域核心关键技术突破,四是前瞻部署基础研究和前沿技术研究,五是加强科技创新基地和平台建设,六是大力培养造就创新型科技人才,七是提升科技开放与合作水平。 科技部发布《关于加快发展民生科技的意见》 7月18日,第四次全国社会发展科技工作会议在京召开,科技部发布了《关于加快发展民生科技的意见》。科技部表示,将根据《关于加快发展民生科技的意见》,组织实施国家民生科技行动,重点围绕人口健康、生态环境、公共安全、防灾减灾四个领域大力推进相关科技工作。 全国政协副主席、科技部长万钢提出了具体要求:全面加强民生科技的领导;切实加大民生科技的投入;加快民生科技创新和能力建设;加强民生科技的国际合作;加强民生相关的科学知识宣传和技术成果的应用普及。 会上,科技部副部长王伟中对“十一五”我国社会发展科技工作的成就进行了全面回顾,对“十二五”社会发展科技工作的重点任务进行了部署。王伟中说,在“十二五”期间,我国社会发展科技工作将把保障和改善民生放在突出位置,重点围绕六个方面开展工作:一是加强科技管理体制机制创新;二是加快组织实施国家科技重大专项;三是加快实施社会发展科技专项规划和计划;四是组织实施国家民生科技行动;五是加强可持续发展实验区建设;六是积极开展社会发展科技领域的国际合作。 “十二五”粮食丰产工程启动 科技部、农业部、财政部和国家粮食局近日在北京分别与湖南等13个粮食主产省(区)签订协议,实施新一轮“国家粮食丰产科技工程”,“十二五”国家粮食丰产科技工程正式启动实施。 科技部在“十一五”期间牵头组织实施了粮食丰产工程。五年来,在国家粮食丰产工程带动下,各相关省市自治区发挥以科技创新为核心,政府引导和市场为主体有机结合,使国家粮食丰产科技工程取得显著成效。工程实施过程中,突出了水稻、小麦和玉米“三大作物”增产,立足东北、华北、长江中下游“三大平原”,强化攻关田、核心区、示范区、辐射区“一田三区”建设。工程的实施为全国粮食大面积高产树立了典范,也为实现粮食增产、保障国家粮食安全提供了强有力的技术支撑。 全国政协副主席、科技部长万钢指出,要促进粮食丰产技术集成和大面积均衡增产;要强化粮食科技服务,鼓励和支持科技人员深入农村基层一线,组织实施好“百千万科技特派员”专项行动,在粮食主产省建立新型科技服务体系;要积极创造条件,强化粮食丰产科技基地、平台、人才队伍建设,稳步推进粮食丰产科技工作;要增加粮食科技投入,逐步完善粮食科技稳定支持的长效机制。

农作物重要品种全基因组de novo测序

首页 科技服务 医学检测 科学与技术 市场与支持 加入我们 关于我们 提供领先的基因组学解决方案Providing Advanced Genomic Solutions 参考文献 [ 1 ] Li Y, Zhou G, Jiang W, et al. De novo assembly of soybean wild relatives for pan-genome analysis of diversity and agronomic traits[J]. Nature biotechnology, 2014, 32(10): 1045-1052. [ 2 ] Da Silva C, Zamperin G, et al. The high polyphenol content of grapevine cultivar tannat berries is conferred primarily by genes that are not shared with the reference genome. Plant Cell, 2013, 25(12):4777-88. [ 3 ] Qi XP, Li M, et al. Identification of a novel salt tolerance gene in wild soybean by whole-genome sequencing. Nature Communica- tions, 2014(5). 挖掘特异基因 解析特有性状 重要品种 全基因组 de novo 所研究品种 小片段文库大片段文库 HiSeq测序(>100X) 基因组组装 注释 全基因组序列比对 转录组遗传图谱等辅助验证 重要农艺性状解析 基因家族聚类分析 所研究品种基因组序列 已发表品种 基因组序列 已发表品种基因集合 所研究品种基因集合 变异检测 小的插入 缺失 SNP 倒位 易位大的插入 缺失 基因挖掘 新基因鉴定拷贝数扩增基因基因丢失正选择基因鉴定 物种 品种 发表杂志(年份) 物种 品种发表杂志(年份) 大豆 棉花 番茄 土豆 水稻 葡萄猪栽培大豆7种野生大豆 野生耐盐大豆雷德氏棉 亚洲棉 陆地棉栽培番茄 抗病番茄栽培土豆 耐寒土豆 Nature (2010) Nature Biotechnology (2014) Nature Communications (2014) Nature (2012)Nature Genetics (2014)Nature Biotechnology (2015)Nature (2012) Nature Genetics (2014) Nature (2011) Plant Cell (2015) 栽培水稻(粳稻)栽培水稻(籼稻) 短花药野生稻 非洲栽培稻五种野生稻三种栽培稻葡萄 丹娜葡萄杜洛克猪藏猪 Science (2002)Science (2002) 野生大豆泛基因组 阅读原文>> 诺禾致源的项目经验 诺禾致源在动植物全基因组测序领域一直处于领先地位, 以第一通讯作者发表基因组文章5篇(影响因子累计152.474),其中2篇为杂志封面文章。 近年来,诺禾通过自主研发软件与技术革新,成功地将项目周期压缩至14个月内,费用降低一半以上。 特有基因检测 对7株代表性野生大豆品种进行全基因组de novo 测序及比较基因组分析,发现每个大豆品种中有1,000~3,000个品种特有的基因。 高变区变异检测 在传统测序方法中,将研究物种短reads 比对参考基因组无法检测到变异位点;在全基因组de novo 方法中,将组装后的超长序列比对参考基因组可准确识别高变区域内的所有变异位点。性状解析方案设计 通过对重要品种高深度(>100X)测序,并进行基因组组装注释: 找到传统测序无法鉴定的高度变异位点,找到更多更准确的SNP位点;找到参考基因组中 所不存在的基因——品种特有基因。 2. 耐盐大豆耐盐基因的发现 2014年,研究人员对一株耐盐大豆开展了全基因组de novo 测序,并与栽培大豆基因组进行全基因组比对,通过一条跨过长达388 Kb 的重要功能区的scaffold,发现了巨大的结构变异,从而成功鉴定出耐盐基因。该基因在栽培大豆中被插入了一个长达3.4 Kb 的反转座子,影响了阳离子转运体功能,从而使栽培大豆失去了耐盐能力。 传统的测序手段,采用的是短reads 比对,因而对这类大的结构变异检测精度差、灵敏度低、甚至难以实现检测,而全基因组de novo 测序则能很好的克服该问题。阅读原文>> 案例分享 1. 丹娜葡萄全基因组测序揭示高丹宁含量性状的分子机制 丹娜葡萄被认为是丹宁含量最高的葡萄品种之一,由于富含丹宁等抗氧化分子,被认为有延缓衰老的作用。通过对其基因组测序,研究人员发现与丹宁合成有关的关键酶,几乎都能找到新的基因。很显然,只依赖已有的参考基因组,完全无法了解丹娜葡萄高丹宁含量这一性状的遗传基础,而全基因组de novo 测序则完美回答了该问题。阅读原文>> 重要品种基因组的价值 一些物种,虽然已有参考基因组,但仍然无法找到性状关联基因。 一方面,参考基因组与研究物种差异太大; 另一方面,性状相关基因处于基因组快速进化区域,变异极大,传统测序手段难以鉴定。 目前,de novo测序在有参品种重要性状探究方面的应用愈发广泛, 相关研究结果常见于国际顶级杂志上。

相关主题