Výpis z elektroerogramu z automatizovaného sekvenceru zobrazující část sekvence DNA
Sekvence DNA nebo genetická sekvence je posloupnost písmen představujících primární strukturu reálné nebo hypotetické molekuly nebo řetězce DNA se schopností nést informace.
Možnými písmeny jsou A, C, G a T, představující čtyři nukleotidové podjednotky řetězce DNA – adenin, cytosin, guanin, thyminové báze kovalentně vázané na fosfo-páteř. Obvykle jsou sekvence tištěny vzájemně bez mezer, jako v sekvenci AAAGTCTGAC, od 5′ do 3′ zleva doprava. Za sekvenci může být nazvána posloupnost libovolného počtu nukleotidů větších než čtyři. S ohledem na svou biologickou funkci, která může záviset na kontextu, může být sekvence smyslová nebo anti-smyslová a buď kódovací nebo nekódovací. Sekvence DNA může také obsahovat „junk DNA“.
Sekvence mohou být odvozeny z biologické suroviny procesem zvaným sekvenování DNA.
V některých zvláštních případech jsou vedle písmen A, T, C a G přítomna v sekvenci. Tato písmena představují nejednoznačnost. Ze všech vzorkovaných molekul je na této pozici více než jeden druh nukleotidu. Pravidla Mezinárodní unie pro čistou a aplikovanou chemii (IUPAC) jsou následující: