Reprezentace 3D struktury proteinu myoglobinu. Alfa šroubovice jsou zobrazeny barevně a náhodná cívka v bílé barvě, nejsou zobrazeny žádné beta listy. Tato bílkovina byla první, která měla svou strukturu vyřešenou rentgenovou krystalografií Maxe Perutze a sira Johna Cowderyho Kendrewa v roce 1958, což vedlo k tomu, že v roce 1962 obdrželi Nobelovu cenu za chemii.
V biochemii a strukturní biologii je sekundární struktura obecnou trojrozměrnou formou lokálních segmentů biopolymerů, jako jsou proteiny a nukleové kyseliny (DNA/RNA). Nepopisuje však specifické atomové pozice v trojrozměrném prostoru, které jsou považovány za terciární strukturu.
Sekundární struktura je formálně definována vodíkovými vazbami biopolymeru, jak je pozorována ve struktuře s atomovým rozlišením. V proteinech je sekundární struktura definována vzorci vodíkových vazeb mezi páteřními amidovými skupinami (sidechain-mainchain a sidechain-sidechain vodíkové vazby jsou irelevantní), kde se používá DSSP definice vodíkové vazby. V nukleových kyselinách je sekundární struktura definována vodíkovou vazbou mezi dusíkatými bázemi.
Vodíková vazba je však korelována s dalšími strukturálními znaky, což dalo vzniknout
méně formálním definicím sekundární struktury. Například rezidua v proteinových šroubovicích obecně
přejímají páteřní dihedrální úhly v určité oblasti Ramachandranského zákresu; tudíž segment
reziduí s takovými dihedrálními úhly je často nazýván „šroubovicí“, bez ohledu na to, zda má správné
vodíkové vazby. Bylo navrženo mnoho dalších méně formálních definic, často uplatňujících pojmy z
diferenciální geometrie křivek, jako je zakřivení a torze. Strukturální biologové
řešící novou strukturu s atomovým rozlišením někdy přiřadí její sekundární strukturu „okem“ a zaznamenají
jejich přiřazení do odpovídajícího PDB souboru.
Obsah hrubé sekundární struktury biopolymeru (např. „tato bílkovina je 40% α-helix a 20% β-list.“)
lze často odhadnout spektroskopicky. U bílkovin je běžnou metodou daleko-ultrafialový
(daleko-UV, 170-250 nm) kruhový dichroismus. Výrazné dvojité minimum při 208 a 222 nm značí α-helikální
strukturu, zatímco jediné minimum při 204 nm nebo 217 nm odráží strukturu náhodné cívky, respektive β-listu.
Méně běžnou metodou je infračervená spektroskopie, která detekuje rozdíly ve vazbě
kmitání amidových skupin v důsledku vodíkového vázání. Obsah sekundární struktury může být
odhadnut přesně pomocí chemických posunů nepřiřazeného spektra NMR.
Sekundární strukturu zavedl Kaj Ulrik Linderstrom-Lang v roce 1952 na lékařských přednáškách Lane na Stanfordu.
Sekundární struktura v proteinech se skládá z lokálních mezireziduálních interakcí zprostředkovaných vodíkovými vazbami. Nejčastějšími sekundárními strukturami jsou alfa šroubovice a beta listy. Jiné šroubovice, jako například 310 šroubovice a π šroubovice, mají podle výpočtů energeticky příznivé vodíkové vazby, ale v přírodních proteinech jsou pozorovány jen zřídka, pokud vůbec, s výjimkou konců α šroubovic kvůli nepříznivému obalu páteře ve středu šroubovice. Jiné prodloužené struktury, jako je polyprolinová šroubovice a alfa list, jsou v proteinech v nativním stavu vzácné, ale často jsou hypoteticky považovány za důležité meziprodukty skládání proteinů. Těsné zatáčky a volné, pružné smyčky spojují „pravidelnější“ prvky sekundární struktury. Náhodná cívka není skutečnou sekundární strukturou, ale je třídou konformací, které naznačují absenci pravidelné sekundární struktury.
Aminokyseliny se liší ve své schopnosti tvořit různé prvky sekundární struktury. Prolin a glycin jsou někdy známy jako „šroubovicové lámače“, protože narušují pravidelnost α šroubovicové konformace páteře; nicméně obě mají neobvyklé konformační schopnosti a běžně se vyskytují střídavě. Aminokyseliny, které preferují přijetí šroubovicové konformace v proteinech, zahrnují methionin, alanin, leucin, glutamát a lysin („MALEK“ v aminokyselinových jednopísmenných kódech); naproti tomu velké aromatické zbytky (tryptofan, tyrosin a fenylalanin) a -rozvětvené aminokyseliny (isoleucin, valin a threonin) preferují přijetí konformace β-vlákna. Tyto preference však nejsou dostatečně silné, aby vytvořily spolehlivou metodu předpovídání sekundární struktury pouze ze sekvence.
Kód DSSP je často používán k popisu proteinových sekundárních struktur jedním písmenným kódem. DSSP je zkratka pro „Dictionary of Protein Secondary Structure“, což byl název původního článku, který ve skutečnosti vyjmenovával sekundární strukturu proteinů se známou 3D strukturou (Kabsch a Sander 1983). Sekundární struktura je přiřazena na základě vodíkových vazebných vzorů, které původně navrhl Pauling et al. v roce 1951 (předtím, než byla jakákoli proteinová struktura kdy experimentálně stanovena).
V DSSP se zbytky, které nejsou v žádné z výše uvedených konformací, označují jako „ (mezera), která se někdy označuje písmeny C (cívka) nebo L (smyčka). Helice (G,H a I) a konformace listů musí mít přiměřenou délku. To znamená, že 2 přilehlé zbytky v primární struktuře musí tvořit stejný vodíkový pojící vzor. Pokud je šroubovice nebo vodíkový pojící vzor listu příliš krátký, označují se písmeny T, respektive B. Existují i jiné kategorie přiřazování proteinových sekundárních struktur (ostré zatáčky, Omega smyčky atd.), ale používají se méně často.
Sekundární struktura je definována vodíkovou vazbou, takže přesná definice vodíkové vazby je kritická. Standardní definice H-vazby pro sekundární strukturu je definice DSSP, což je čistě elektrostatický model. Přiřazuje náboje karbonylovému uhlíku, respektive kyslíku, a náboje amidovému dusíku, respektive vodíku. Elektrostatická energie je
Podle DSSP existuje H-vazba tehdy a jen tehdy, je-li menší než -0,5 kcal/mol. Ačkoliv je DSSP vzorec poměrně hrubou aproximací fyzikální energie H-vazby, je obecně přijímán jako nástroj pro definování sekundární struktury.
Předpověď sekundární struktury proteinů
První metody predikce sekundární struktury byly založeny na sklonech jednotlivých aminokyselin k tvoření šroubovice nebo listu, někdy ve spojení s pravidly pro odhad volné energie tvoření prvků sekundární struktury. Takové metody jsou typicky ~60% přesné v predikci toho, který ze tří stavů (šroubovice/list/cívka) si reziduum osvojí. Výrazného zvýšení přesnosti (na téměř ~80%) bylo dosaženo využitím vícenásobné sekvenční synchronizace; znalost plného rozložení aminokyselin, které se vyskytují na určité pozici (a v její blízkosti, typicky ~7 reziduí na každé straně) v průběhu evoluce poskytuje mnohem lepší obrázek o strukturních tendencích v blízkosti této pozice. Pro ilustraci, daný protein může mít glycin na dané pozici, což samo o sobě může naznačovat náhodnou cívku tam. Nicméně vícesekvenční zarovnání může odhalit, že na této pozici (a blízkých pozicích) se vyskytují aminokyseliny upřednostňující šroubovice v 95% homologních proteinů pokrývajících téměř miliardu let evoluce. Navíc, zkoumáním průměrné hydrofobity na této a blízkých pozicích, by stejné zarovnání mohlo také naznačovat vzor dostupnosti rozpouštědla reziduí odpovídající α-šroubovici. Dohromady by tyto faktory naznačovaly, že glycin původního proteinu přijímá α-šroubovici strukturu, spíše než náhodnou cívku. Několik typů metod se používá ke kombinování všech dostupných dat k vytvoření 3-stavové predikce, včetně neuronových sítí, skrytých Markovových modelů a podpůrných vektorových strojů. Moderní metody predikce také poskytují skóre spolehlivosti pro jejich predikce na každé pozici.
Metody predikce sekundárních struktur jsou průběžně srovnávány, např. v EVA experimentu. Na základě ~270 týdnů testování jsou v současnosti nejpřesnějšími metodami PsiPRED, SAM, PORTER, PROF a SABLE. Zajímavé je, že se nezdá být možné tyto metody vylepšit jejich konsensem [nutná citace]. Hlavní oblastí pro zlepšení se zdá být predikce β-vláken; zbytky sebevědomě predikované jako β-vlákno tak pravděpodobně budou, ale metody jsou schopné přehlédnout některé segmenty β-vlákna (falešné negativy). Pravděpodobně existuje horní hranice ~90% přesnosti predikce celkově, vzhledem k výstřednostem standardní metody (DSSP) pro přiřazování tříd sekundárních struktur (helix/vlákno/cívka) ke strukturám PDB, proti které jsou predikce srovnávány.
Přesná predikce sekundární struktury je klíčovým prvkem predikce terciární struktury, a to ve všech případech kromě těch nejjednodušších (homologické modelování). Například s jistotou predikovaný vzorec šesti elementů sekundární struktury βαββαβ je signaturou feredoxinového lomu.
Nukleové kyseliny mají také sekundární strukturu, především jednovláknové molekuly RNA. Sekundární struktura RNA je obecně rozdělena na šroubovice (souvislé páry bází) a různé druhy smyček (nepárové nukleotidy obklopené šroubovicemi). Struktura stonku-smyčky, ve které šroubovice v páru bází končí krátkou nepárovou smyčkou, je extrémně běžná a je stavebním kamenem pro větší strukturální motivy, jako jsou například struktury čtyřšroubovice, což jsou čtyřšroubovicové spoje, jaké se vyskytují v transferové RNA. Časté jsou také vnitřní smyčky (krátká řada nepárových bází v delší párové šroubovici) a vybouleniny (oblasti, ve kterých má jedno vlákno šroubovice „extra“ vložené báze bez protějšků v opačném vlákně). A konečně, v RNA (i když ne DNA) jsou přítomny jak pseudouzly, tak i trojčíslí bází. Extrémně složité sekundární struktury DNA byly navrženy a vyrobeny v DNA origami a dalších produktech DNA nanotechnologie.
Vzhledem k tomu, že je téměř výhradně zprostředkována párem bází, lze říci, že sekundární struktura RNA definuje, které báze jsou párovány v molekule nebo komplexu. Tradiční párování bází Watson-Crick však není jediným typem párování, které je v RNA přípustné; běžné je také Hoogsteenovo párování bází.
Predikce sekundární struktury RNA
Jedna aplikace bioinformatiky využívá predikované sekundární struktury RNA při hledání genomu pro nekódující, ale funkční formy RNA. Například mikroRNA mají kanonické struktury dlouhých kmenových smyček přerušované malými vnitřními smyčkami. Obecnou metodou výpočtu pravděpodobné sekundární struktury RNA je dynamické programování, i když to má tu nevýhodu, že nedokáže detekovat pseudouzly nebo jiné případy, kdy páry bází nejsou zcela vnořeny. Obecnější metody jsou založeny na stochastických bezkontextových gramatikách. Webový server, který implementuje typ dynamického programování, je Mfold.
Pro mnoho molekul RNA je sekundární struktura velmi důležitá pro správnou funkci RNA – často více než vlastní sekvence. Tento fakt pomáhá při analýze nekódující RNA, někdy nazývané „geny RNA“. Sekundární strukturu RNA lze s určitou přesností předpovědět počítačem (například webový server RNAsoft) a mnoho bioinformatických aplikací používá v analýze RNA určitou představu o sekundární struktuře.
Jak proteinové, tak RNA sekundární struktury mohou být použity k podpoře vícesekvenčního zarovnání. Tato zarovnání mohou být zpřesněna zahrnutím informace o sekundární struktuře kromě jednoduché sekvenční informace. To je někdy méně užitečné v RNA, protože párování bází je mnohem více konzervováno než sekvence. Vzdálené vztahy mezi proteiny, jejichž primární struktury jsou nealigentní, mohou být někdy nalezeny sekundární strukturou.