Die Chromatin-Immunpräzipitation ist eine Methode zur Kartierung von Protein-DNA-Interaktionen im Genom. Sie identifiziert die genomischen Bindungsstellen von Transkriptionsfaktoren, Histonen mit spezifischen Modifikationen und anderen Chromatin-assoziierten Proteinen und liefert Einblicke in die Genregulation und Chromatinstruktur.
Grundprinzip
ChIP beginnt mit der Quervernetzung von Proteinen an DNA in lebenden Zellen, typischerweise unter Verwendung von Formaldehyd, das kovalente Quervernetzungen zwischen Proteinen und DNA innerhalb weniger Angström erzeugt. Das quervernetzte Chromatin wird durch Ultraschall oder enzymatischen Verdau in Fragmente von 200 bis 600 Basenpaaren geschert. Ein Antikörper, der spezifisch für das interessierende Protein ist, wird verwendet, um die Protein-DNA-Komplexe zu immunpräzipitieren. Die Quervernetzungen werden rückgängig gemacht und die DNA wird gereinigt. Die angereicherten DNA-Fragmente werden dann durch quantitative PCR, Microarray oder Sequenzierung identifiziert.
Quervernetzung
Die Formaldehyd-Quervernetzung ist die Standardmethode und erzeugt Methylenbrücken zwischen nahe beieinander liegenden Aminogruppen. Sie ist durch Hitze reversibel und wirksam für Proteine, die direkt DNA kontaktieren. Für Proteine, die DNA indirekt oder schwach binden, können alternative Quervernetzer wie Ethylenglycol-bis-succinimidylsuccinat verwendet werden. Native ChIP verzichtet auf Quervernetzung und funktioniert für fest gebundene Proteine wie Histone.
Chromatin-Scherung
Beschallung erzeugt zufällige DNA-Fragmente durch mechanische Scherung. Die Fragmentgrößenverteilung ist kritisch, da kleinere Fragmente eine höhere Auflösung der Bindungsstellen liefern. Die Beschallungsbedingungen müssen für jeden Zelltyp optimiert werden, um Über- oder Unterscherung zu vermeiden. Der enzymatische Verdau mit Mikrokokken-Nuklease ist eine Alternative für native ChIP und spaltet DNA zwischen Nukleosomen.
Immunpräzipitation
Der Erfolg von ChIP hängt von der Antikörperqualität ab. Der Antikörper muss sein Ziel in quervernetztem Chromatin mit hoher Spezifität und Affinität erkennen. ChIP-geeignete Antikörper sind für diese Anwendung validiert. Protein-A- oder Protein-G-Agarose- oder Magnetkügelchen werden verwendet, um die Antikörper-Chromatin-Komplexe einzufangen. Magnetkügelchen werden aufgrund des geringeren Hintergrunds und der schnelleren Verarbeitung bevorzugt.
ChIP-qPCR
Für bekannte Zielgene quantifiziert die ChIP-qPCR (quantitative PCR) die Anreicherung an spezifischen genomischen Regionen. Primer werden für die vermutete Bindungsstelle und für eine Negativkontrollregion entworfen. Die Anreicherung wird als fache Zunahme gegenüber der Negativkontrolle oder dem Input-Chromatin berechnet. ChIP-qPCR ist empfindlich, quantitativ und für hypothesengetriebene Studien ausgewählter Loci geeignet.
ChIP-on-Chip
Die Microarray-basierte ChIP hybridisiert die ChIP-angereicherte DNA auf Tiling-Microarrays, die genomische Regionen von Interesse abdecken. Die Input-DNA wird mit einem Fluorophor und die ChIP-DNA mit einem anderen markiert. Genomische Regionen mit hohen Verhältnissen entsprechen Bindungsstellen. Die Auflösung ist durch Fragmentgröße und Sondenabstand begrenzt. ChIP-on-Chip wurde weitgehend durch ChIP-seq ersetzt.
ChIP-Sequenzierung
ChIP-seq kombiniert ChIP mit Next-Generation-Sequenzierung. Die immunpräzipitierten DNA-Fragmente werden sequenziert und die Reads werden auf das Referenzgenom ausgerichtet. Regionen mit statistisch signifikanter Read-Anreicherung, Peaks genannt, zeigen Proteinbindungsstellen an. ChIP-seq bietet höhere Auflösung, geringeres Rauschen und genomweite Abdeckung ohne vordefinierte Sonden. Peak-Calling-Algorithmen wie MACS identifizieren Regionen, in denen die Read-Dichte die Hintergrundverteilung signifikant übersteigt.
Datenanalyse
Die ChIP-seq-Datenanalyse beginnt mit Qualitätskontrolle, Read-Alignment und Entfernung von PCR-Duplikaten. Peak-Calling identifiziert angereicherte Regionen unter Verwendung eines Poisson- oder negativen Binomialmodells. Die Mehrfachtestkorrektur kontrolliert die False Discovery Rate. Die nachgeschaltete Analyse umfasst die Annotation von Peaks zu nahegelegenen Genen, die Motiventdeckung zur Identifizierung von Sequenzpräferenzen und den Vergleich über Bedingungen hinweg.
Anwendungen
ChIP-seq kartiert Transkriptionsfaktor-Bindungsstellen genomweit und zeigt die regulatorischen Netzwerke auf, die die Genexpression steuern. Es kartiert Histonmodifikationsmuster, die aktive Promotoren, Enhancer und reprimiertes Chromatin definieren. ChIP-seq für RNA-Polymerase II identifiziert transkribierte Gene und pausierende Polymerasen. Die ENCODE- und Roadmap-Epigenomics-Projekte haben tausende von ChIP-seq-Datensätzen erzeugt und umfassende Karten der regulatorischen Landschaft des menschlichen Genoms erstellt.