Koppelingsanalyse

Om er zeker van te zijn dat ons genetisch verhaal ook voor de minder genetisch onderbouwden helder is, volgt hieronder een korte bespreking over wat nu precies een LOD-score is. Het betreft hier een lichte bewerking van de tekst die wij zelf ook gebruikten om dit fenomeen te doorgronden. Omwille van de uitermate sterke didactische opbouw hebben wij er niet teveel aan gesleuteld en enkel hier en daar wat anders bewoord en ingekort.

Inleiding
Wanneer genetische kenmerken louter afhankelijk zijn van één locus dan is deze mendeliaans. Hierbij komen we dan tot de overervingsmogelijkheden autosomaal dominant (AD), autosomaal recessief (AR), geslachts(X)-gebonden dominant of geslachts(X)-gebonden recessief.
Indien een genetisch kenmerk niet mendeliaans is, dan is deze multifactorieel, oftewel bepaald door een combinatie van genetische en omgevingsfactoren en hoeft dus niet door een enkele locus bepaald te worden.
Met behulp van koppelingsanalyse kan men kwantitatief bepalen of een kenmerk bepaald wordt door één enkele locus die in de nabijheid ligt van andere reeds gekende loci op een genoom en tevens de afstand hiertoe. Zo kan men dan het kenmerk op de genetische kaart van het genoom zetten

Enkele definities en principes
locus: fysische plaats op een chromosoom. Op een locus bevindt zich een bepaalde sequentie of gen. Een locus draagt een specifiek allel van dit gen.
allel: een van de alternatieve vormen van een gen op een bepaald locus.
genetische marker: elk locus kan gebruikt worden als genetische marker van zodra het mogelijk is genetische variatie ter hoogte van dit locus te detecteren.
haplotype: in een strikte betekenis, de specifieke allelen van verschillende loci die zich op dezelfde fysische chromosoom bevinden. In de brede betekenis zeggen we dat een set allelen voor verschillende loci een haplotype vormen. We erven dan een haplotype van onze moeder en een haplotype van onze vader.
genotype: genetische constitutie van een organisme. Ons genotype wordt gedefinieerd door twee specifieke allelen voor elke locus.

Normaalgesproken is er sprake van onafhankelijke segregatie van allelen, dus onafhankelijke overerving. Voor twee markers met als allelen respectievelijk A, a en B, b zijn de mogelijke haplotypes van de gameten: AB, Ab, ab en aB. Deze worden in een ratio 1:1:1:1 doorgegeven aan de nakomelingen.
Sommige paren van genen worden niet onafhankelijk overgeërfd, deze genen zijn gekoppeld. Veronderstellen we een individu met als haplotypes AB en ab voor twee loci zoals hierboven beschreven. Erven nakomelingen van dit individu het AB of het ab haplotype, dan noemen we deze niet-recombinant voor deze twee loci. Nakomelingen die een Ab of aB haplotype erven van deze ouder hebben een recombinant haplotype. Segregeren deze twee genen niet onafhankelijk, dan zullen de niet-recombinante haplotypes voor deze twee genen frequenter voorkomen bij de nakomelingen dan de recombinante haplotypes. De allelen van beide genen overgeërfd van één ouder zijn dan schijnbaar gekoppeld, zij het niet absoluut. Dit fenomeen heet genetische koppeling (genetische linkage). Kwantitatief wordt koppeling gemeten als de recombinatiefractie
q, de verhouding recombinanten/niet-recombinanten. Dit is ook de waarschijnlijkheid dat een bepaalde ouder een recombinant haplotype doorgeeft aan een kind. Loci die onafhankelijk overerven zijn niet gekoppeld. De geobserveerde recombinatiefractie is dan q =½. Zijn twee loci volledig gekoppeld, dan komen er geen recombinanten voor en q = 0.
Deze definitie van koppelingsanalyse heeft drie belangrijke gevolgen:
a) koppelingsanalyse vereist onderzoek van verwante individuen, niet verwante individuen zullen geen informatie opleveren.
b) recombinante en niet-recombinante haplotypes kunnen niet altijd onderscheiden worden. Stel dat een persoon een Ab/ab genotype bezit (de twee haplotypes zijn dan Ab en ab). Omwille van de homozygositeit van de tweede locus (genotype b/b) kan men de recombinante haplotypes afkomstig van dit individu niet onderscheiden van de niet-recombinante haplotypes. Om dit onderscheid te kunnen maken moet een persoon dus heterozygoot zijn voor beide loci. Dan alleen is een individu informatief voor koppelingsanalyse.
c) een Ab haplotype is recombinant als het afkomstig is van een AB/ab individu en niet-recombinant als het voortkomt van een individu met Ab/aB genotype. Deze twee mogelijkheden voor een dubbele heterozygoot moeten dus onderscheiden worden (met andere woorden, een persoon met haplotypes Ab en aB moet onderscheiden worden van een persoon met haplotypes AB en ab). De specifieke haplotypes die voorkomen bij een dubbele heterozygoot worden ook fase genoemd.

Homologe recombinatie
Gameten ontstaan uit diploïde kiemcellen door meiose. Tijdens dit proces kan genetisch materiaal uitgewisseld worden door homologe recombinatie of crossing-over. Zo worden dus de recombinante haplotypes gegenereerd. Dergelijke crossing-over kan overal op een chromosoom plaatsgrijpen. De kans dat dit voorkomt tussen twee loci die op één chromosoom liggen is dus veel kleiner als deze dicht bijeen liggen dan wanneer zij ver van elkaar verwijderd zijn. Er is dus een verband tussen de fysische en de genetische afstand die twee loci scheidt. De recombinatie fractie q wordt ook uitgedrukt in centiMorgan (cM): 1 cM komt overeen met 1% recombinatie. Gemiddeld komt 1% recombinatie overeen met 106 bp (1 mb). Hier kunnen lokaal echter grote verschillen optreden: op specifieke plaatsen van het menselijk genoom kan 1% recombinatie overeenstemmen met 5 . 104 bp, op andere met meerdere mb.
In het algemeen is er meer recombinatie aan de uiteinden van de chromosomen dan rond de centromeer. Recombinatie is ook frequenter in de vrouwelijke meiose dan in de mannelijke meiose. Er zijn dus vrouwelijke en mannelijke genetische kaarten. Voor de meeste toepassingen wordt hiervan een gemiddelde genomen.

Kwantitatieve methodes
Het hoofdprobleem bij de constructie van een genetische kaart van de mens is de bepaling van de meest waarschijnlijke reële recombinatiefractie uitgaande van een beperkt aantal observaties in families. Stel dat we binnen één familie de overerving van twee merkers analyseren en een aantal recombinaties waarnemen. De vraag is nu wat deze waarneming ons leert over de reële recombinatiefrequentie tussen de twee merkers, en met welke statistische zekerheid. Het is immers mogelijk dat de gemeten recombinatie frequentie in de familie afwijkt van gemiddelde recombinatie frequentie tussen de twee merkers in de populatie. Beschouwen we de overerving van twee merkers de 3-generatie familie uit nevenstaande stamboom. De vader is dubbel heterozygoot voor beide merkers en dus informatief. De haplotypes van de vader (of de fase) kunnen bepaald worden door de genotypes van zijn ouders te analyseren. De moeder is homozygoot voor beide merkers en dus niet informatief. Er zijn dus vier informatieve chromosomen (preciezer: meioses), drie niet-recombinanten (*) en één recombinant (!). De geobserveerde recombinatiefrequentie tussen de merkers A en B binnen deze familie is dus 0,25. Het is echter duidelijk dat als wij de hele populatie zouden onderzoeken de gemiddelde recombinatiefrequentie tussen de twee merkers dan merkelijk zou kunnen verschillen van de waarde in die familie, omdat recombinatie een toevallig proces is.
Er is dus behoefte aan e
en statistische methode om, uitgaande van deze experimentele waarnemingen, de gemiddelde of reële recombinatiefractie te bepalen tussen merkers, en een idee te krijgen over de statistische zekerheid waarmee wij die uitspraak kunnen doen. De meest gebruikte statistische methode voor koppelingsanalyse is de lod score (logarithm of odds) methode. L(q) wordt gedefinieerd als de probabiliteit dat we een waarneming doen in een experiment (familie) als de reële gemiddelde recombinatiefractie q is (gekoppelde merkers). De wijze waarop L(q) wordt berekend is dus afhankelijk van de structuur van de familie die we analyseren. De waarschijnlijkheid dat er bij één meiose recombinatie optreed is q. De waarschijnlijkheid dat erbij één meiose geen recombinatie optreed is dus (1-q). In deze familie is zijn vier informatieve meioses. Bij één van deze vier meioses trad er recombinatie tussen de merkers op. Voor deze waarneming is L(q) = (1-q)3q
Vervangen wij in die formule q door 0,5 (recombinatiefractie 0,5 of 50% recombinatie zoals wij verwachten voor twee merkers die onafhankelijk segregeren), dan verkrijgen we L(½). Dat is dan de probabiliteit dat we die waarneming doen als de twee merkers volledig onafhankelijk overgeërfd worden. Voor die waarneming binnen die familie is L(0,5) = 1/16. Dit betekent dat zelfs als de twee merkers volledig onafhankelijk zijn er 1 kans op 16 is dat er in een familie zoals hierboven beschreven slechts 1 recombinatie wordt waargenomen.Beide probabiliteiten (L(q) en L(½)) hebben een waarde tussen 0 en 1. Absoluut betekenen deze getallen echter niet veel omdat ze sterk afhangen van het aantal geobserveerde haplotypes in de familie.

Daarom definiëren we de lod score Z(q) als: Z(q)=log [ L(q)/L(0,5)]

Die formule geeft dan een absolute maat voor hoeveel waarschijnlijker het is dat wij een bepaalde waarneming doen in een familie (experiment) als de recombinatie fractie q zou zijn, dan als die 0,5 zou zijn.
Door
q te laten variëren tussen 0 en 0,5 kunnen we de maximale lod score en de meest waarschijnlijke recombinatiefractie bepalen. Een maximale lod score >3 bij een recombinatiefractie q wordt als significante evidentie voor koppeling met de recombinatie fractie q beschouwd. Dit betekent dat een bepaalde waarneming in een familie duizend maal waarschijnlijker is bij koppeling van twee merkers met een recombinatiefractie q dan bij onafhankelijke segregatie van deze merkers. Een lod score van -2 wordt als significantiegrens voor niet-koppeling genomen.
In het voorbeeld hier is:

Z(q) = log[16(1-q)3q]
Dus voor
q = 0 is Z(q) = -
q
= 0,05 is Z(q) = - 0,164
q = 0,1 is Z(q) = 0,067
q = 0,25 is Z(q) = 0,227
q = 0,35 is Z(q) = 0,187

De probabiliteit dat twee of meer onafhankelijke waarnemingen samen voorkomen is het product van de probabiliteiten voor elke waarneming afzonderlijk. Lod scores zijn logaritmes, lod scores voor twee markers bekomen in verschillende families kunnen dus opgeteld worden. Bekomen we zo een score > 3 dan zijn beide markers gekoppeld met een bepaalde maximale recombinatiefractie q. Bekomen we een score < -2 dan is koppeling bij die q uitgesloten. Merk op dat van het ogenblik dat er één recombinant haplotype wordt opgemerkt, de lod score bij q=0 noodzakelijk - is of de probabiliteit voor q = 0 is 0.
In de praktijk zal men dus nieuwe waarnemingen blijven doen tot Z(
q) groter is dan 3. Is Z(q) > 3 dan zegt men dat de twee merkers gekoppeld zijn en de q waarbij Z(q) maximaal is, geeft de afstand tussen de twee merkers. Is Z(q) < -2, dan zegt men dat de koppeling van de twee merkers met een deze q uitgesloten is.

Nog enkele nuttige definities:
Genetische kaart: een genetische kaart is een verzameling geordende, gekoppelde merkers die verspreid zijn over het volledige genoom. De afstand tussen de merkers wordt gemeten als % recombinatie en uitgedrukt in cM. De genetische kaart van de mens omvat ongeveer 3000 cM.
Genetische heterogeniteit: als er verschillende genen zijn die onafhankelijk van elkaar éénzelfde fenotype veroorzaken, dan spreken we van genetische heterogeniteit.
Penetrantie: soms leidt de aanwezigheid van een allel niet altijd tot het fenotype dat hiermee samenhangt. We spreken dan van onvolledige penetrantie. Als een individu het allel bezit, vertoont het het fenotype, of niet. Als we spreken van 80% penetrantie, betekent dit dat 80 % van de individuen die het allel bezitten ook het fenotype vertonen
Variabele expressie: de aanwezigheid van een allel bij verschillende individuen kan tot een verschillende ‘ernst’ van het fenotype leiden. Meestal is dit het gevolg van het effect van andere (modifier) genen.
Pleiotrope effecten – allelism: soms kunnen de verschillende allelen van een gen tot verschillende fenotypes leiden. Zo kan bijvoorbeeld een null allel tot een ernstig complex klinisch syndroom leiden en een missense puntmutatie in hetzelfde gen enkel tot mentale retardatie. Dit noemen we pleiotropisme of allelisme.

Terug naar start