Cet algo utilise la substitution de certaines lettres de l'alphabet par l'intermédiaire des codons génétiques de l'ADN et de l'ARN.
Tout d'abord, petit moment culture:
Un codon est une séquence de trois nucléotides d'un ADN spécifiant un acide aminé. Les codons sont donc traduits en acide aminé. Ces codons sont constitués par 3 des 4 bases nucléiques qui composent l'ADN: U C A G.
Exemple de codons: UUU, ACA, GCU...
Chaque codon correspond à un acide aminé et donc à une lettre de l'alphabet qui désigne communément cet acide aminé.
Voici la liste des acides aminés et leur lettre représentative :
On peut voir que: B, J, X et Z ne sont pas utilisés dans la nomenclature.
Important: plusieurs codons peuvent coder pour un même acide aminé.
Voici maintenant ce qui nous intéresse, la correspondance codon <-> lettre.
La liste est donnée de cette manière: codon (abréviation de l'acide aminé) -> lettre
Voici pour l'ADN:
Voici pour l'ARN:
Il faut donc prendre en compte les différentes combinaisons de codage possibles d'un même acide aminé par plusieurs codons.
Exemple pour l'ARN:
input -> SALUT LES POTOS
output ->
AGUGCUUUAUGAACUUAACUUGAAAGUUAACCUOACUOAGU
AGCGCCUUGUGAACCUAACUCGAGAGCUAACCCOACCOAGC
...
Exemple pour l'ADN:
input -> HELLO WORLD
output ->
CATGAACTTCTCOTAATGGOCGTCTTGAT
CACGAGCTCCTTOTAATGGOCGCCTCGAC
...
Exemple pour ADN+ARN mixé:
input -> HACKADEMY POWER
output ->
CATGCUTGTAAAGCAGAUGAAAUGTATTAACCTOUGGGAAAGA
CACGCCTGCAAGGCGGACGAGAUGTACUAACCCOUGGGAGAGG
...
Les lettres non utilisées apparaissent généralement en clair.
Tout d'abord, petit moment culture:
Un codon est une séquence de trois nucléotides d'un ADN spécifiant un acide aminé. Les codons sont donc traduits en acide aminé. Ces codons sont constitués par 3 des 4 bases nucléiques qui composent l'ADN: U C A G.
Exemple de codons: UUU, ACA, GCU...
Chaque codon correspond à un acide aminé et donc à une lettre de l'alphabet qui désigne communément cet acide aminé.
Voici la liste des acides aminés et leur lettre représentative :
Code:
Alanine (Ala) -> A Cystéine (Cys) -> C Acide aspartique (Asp) -> D Glutamate (Glu) -> E Phenylalanine (Phe) -> F Glycine (Gly) -> G Histidine (His) -> H Isoleucine (Ile) -> I Lysine (Lys) -> K Leucine (Leu) -> L Méthionine (Met) -> M Asparagine (Asn) -> N Pyrrolysine (Pyl) -> O Proline (Pro) -> P Glutamine (Gln) -> Q Arginine (Arg) -> R Sérine (Ser) -> S Théonine (Thr) -> T Sélénocystéine (Sec) -> U Valine (Val) -> V Tryptophane (Trp) -> W Tyrosine (Tyr) -> Y
On peut voir que: B, J, X et Z ne sont pas utilisés dans la nomenclature.
Important: plusieurs codons peuvent coder pour un même acide aminé.
Voici maintenant ce qui nous intéresse, la correspondance codon <-> lettre.
La liste est donnée de cette manière: codon (abréviation de l'acide aminé) -> lettre
Voici pour l'ADN:
Code:
GCT (Ala) -> A GCC (Ala) -> A GCA (Ala) -> A GCG (Ala) -> A TGT (Cys) -> C TGC (Cys) -> C GAT (Asp) -> D GAC (Asp) -> D GAA (Glu) -> E GAG (Glu) -> E TTT (Phe) -> F TTC (Phe) -> F GGT (Gly) -> G GGC (Gly) -> G GGA (Gly) -> G GGG (Gly) -> G CAT (His) -> H CAC (His) -> H ATT (Ile) -> I ATC (Ile) -> I ATA (Ile) -> I AAA (Lys) -> K AAG (Lys) -> K CTT (Leu) -> L CTC (Leu) -> L CTA (Leu) -> L CTG (Leu) -> L ATG (Met) -> M AAT (Asn) -> N AAC (Asn) -> N TAG (Pyl) -> O CCT (Pro) -> P CCC (Pro) -> P CCA (Pro) -> P CCG (Pro) -> P CAA (Gln) -> Q CAG (Gln) -> Q CGT (Arg) -> R CGC (Arg) -> R CGA (Arg) -> R CGG (Arg) -> R AGT (Ser) -> S AGC (Ser) -> S ACT (Thr) -> T ACC (Thr) -> T ACA (Thr) -> T ACG (Thr) -> T TGA (Sec) -> U GTT (Val) -> V GTC (Val) -> V GTA (Val) -> V GTG (Val) -> V TGG (Trp) -> W TAT (Tyr) -> Y TAC (Tyr) -> Y TAA -> ESPACE
Code:
GCU (Ala) -> A GCC (Ala) -> A GCA (Ala) -> A GCG (Ala) -> A UGU (Cys) -> C UGC (Cys) -> C GAU (Asp) -> D GAC (Asp) -> D GAA (Glu) -> E GAG (Glu) -> E UUU (Phe) -> F UUC (Phe) -> F GGU (Gly) -> G GGC (Gly) -> G GGA (Gly) -> G GGG (Gly) -> G CAU (His) -> H CAC (His) -> H AUU (Ile) -> I AUC (Ile) -> I AUA (Ile) -> I AAA (Lys) -> K AAG (Lys) -> K CUU (Leu) -> L CUC (Leu) -> L CUA (Leu) -> L CUG (Leu) -> L AUG (Met) -> M AAU (Asn) -> N AAC (Asn) -> N UAG (Pyl) -> O CCU (Pro) -> P CCC (Pro) -> P CCA (Pro) -> P CCG (Pro) -> P CAA (Gln) -> Q CAG (Gln) -> Q AGA (Arg) -> R AGG (Arg) -> R AGU (Ser) -> S AGC (Ser) -> S ACU (Thr) -> T ACC (Thr) -> T ACA (Thr) -> T ACG (Thr) -> T UGA (Sec) -> U GUU (Val) -> V GUC (Val) -> V GUA (Val) -> V GUG (Val) -> V UGG (Trp) -> W UAU (Tyr) -> Y UAC (Tyr) -> Y UAA -> ESPACE
Exemple pour l'ARN:
input -> SALUT LES POTOS
output ->
AGUGCUUUAUGAACUUAACUUGAAAGUUAACCUOACUOAGU
AGCGCCUUGUGAACCUAACUCGAGAGCUAACCCOACCOAGC
...
Exemple pour l'ADN:
input -> HELLO WORLD
output ->
CATGAACTTCTCOTAATGGOCGTCTTGAT
CACGAGCTCCTTOTAATGGOCGCCTCGAC
...
Exemple pour ADN+ARN mixé:
input -> HACKADEMY POWER
output ->
CATGCUTGTAAAGCAGAUGAAAUGTATTAACCTOUGGGAAAGA
CACGCCTGCAAGGCGGACGAGAUGTACUAACCCOUGGGAGAGG
...
Les lettres non utilisées apparaissent généralement en clair.