Gens
Un gen és la unitat bàsica de l’herència, i porta la informació genètica necessària per a la síntesi d’una proteïna (gens codificants) o d’un ARN no codificant (gens d’ARN). Està format per una seqüència promotora, que regula la seva expressió, i una seqüència que es transcriu, composta al seu torn per: seqüències UTR (regions flanquejants no traduïdes), necessàries per a la traducció i l’estabilitat de l’ARNm, exons (codificants) i introns , que són seqüències d’ADN no traduïdes situades entre dos exons que seran eliminades en el processament de l’ARNm: els introns són regions freqüentment trobades en els gens d’eucariotes, que es transcriuen, però són eliminades en el processament de l’ARN (empalmament) per produir un ARNm format només per exons, encarregats de traduir una proteïna. Aquest diagrama és en excés simplificat ja que mostra un gen compost per uns 40 parells de bases quan en realitat la seva mida mitjana és de 20.000-30.000 parells de bases).
Actualment s’estima que el genoma humà conté entre 20.000 i 25.000 gens codificants de proteïnes, estimació molt inferior a les prediccions inicials que parlaven d’uns 100.000 gens o més. Això implica que el genoma humà té menys del doble de gens que organismes eucariotes molt més simples, com la mosca de la fruita o el nematode Caenorhabditis elegans. No obstant això, les cèl·lules humanes recorren àmpliament a l’splicing (empalmament) alternatiu per produir diverses proteïnes diferents a partir d’un mateix gen, com a conseqüència de la qual cosa el proteoma humà és més ampli que el d’altres organismes molt més simples. A la pràctica, el genoma tan sols porta la informació necessària per a una expressió perfectament coordinada i regulada del conjunt de proteïnes que conformen el proteoma, sent aquest l’encarregat d’executar la major part de les funcions cel·lulars.
Amb base en els resultats inicials llançats pel projecte ENCODE (acrònim de Encyclopedia Of DNA Elements), alguns autors han proposat redefinir el concepte actual de gen. Les observacions més recents fan difícilment sostenible la visió tradicional d’un gen, com una seqüència formada per les regions UTRs, els exons i els introns. Estudis detallats han trobat un nombre de seqüències d’inici de transcripció per gen molt superior a les estimacions inicials, i algunes d’aquestes seqüències se situen en regions molt allunyades de la traduïda, de manera que els UTR 5 ‘poden abastar seqüències llargues dificultant la delimitació de el gen. D’altra banda, un mateix transcrit pot donar lloc a ARN madurs totalment diferents (absència total de solapament), a causa d’una gran utilització de l’splicing alternatiu. D’aquesta manera, un mateix transcrit primari pot donar lloc a proteïnes de seqüència i funcionalitat molt dispar. En conseqüència, alguns autors han proposat una nova definició de gen ,: la unió de seqüències genòmiques que codifiquen un conjunt coherent de productes funcionals, potencialment solapantes. D’aquesta manera, s’identifiquen com a gens els gens ARN i els conjunts de seqüències traduïdes parcialment solapants (s’exclouen, així, les seqüències UTR i els introns, que passen a ser considerats com a “regions associades a gens”, juntament amb els promotors) . D’acord amb aquesta definició, un mateix transcrit primari que dóna lloc a dos transcrits secundaris (i dues proteïnes) no solapantes s’ha de considerar en realitat dos gens diferents, independentment que aquests presentin un solapament total o parcial dels seus transcrits primaris.
les noves evidències aportades per ENCODE, segons les quals les regions UTR no són fàcilment delimitables i s’estenen llargues distàncies, obligarien a reidentificar novament els gens que en realitat componen el genoma humà. D’acord amb la definició tradicional (actualment vigent), seria necessari identificar com un mateix gen a tots aquells que mostrin un solapament parcial (incloent les regions UTR i els introns), de manera que a la llum de les noves observacions, els gens inclourien múltiples proteïnes de seqüència i funcionalitat molt diversa. Col·lateralment es reduiria el nombre de gens que componen el genoma humà. La definició proposada, en canvi, es fonamenta en el producte funcional de el gen, de manera que es manté una relació més coherent entre un gen i una funció biològica. Com a conseqüència, amb l’adopció d’aquesta nova definició, el nombre de gens de l’genoma humà augmentarà significativament.