Transcription factors and many other DNA-binding proteins recognize more than one specific sequence. Among sequences recognized by a given DNA-binding protein, different positions exhibit varying degrees of conservation. The reason is that base pairs that are more extensively contacted by the protein tend to be more conserved. This observation can be used in the discovery of transcription factor binding sites. Here we present a rigorous means to accomplish this. In particular, we constrain the order of the information (entropy) in the columns of the position specific weight matrix (PWM) which characterizes the motif being sought. We then show how to compute the maximum likelihood estimate of a PWM under such order restrictions. This computation is easily integrated with the EM algorithm or the Gibbs sampler to enhance performance in the search for motifs in unaligned sequences. We demonstrate our method on a well-known data set of binding sites of the transcription factor Crp in E. coli.
Inhalt
- Article
-
Erfordert eine Authentifizierung Nicht lizenziertEstimating Motifs Under Order RestrictionsLizenziert10. Januar 2005
-
Erfordert eine Authentifizierung Nicht lizenziertReproducible Research: A Bioinformatics Case StudyLizenziert11. Januar 2005
-
Erfordert eine Authentifizierung Nicht lizenziertGeneralized Rank Tests for Replicated Microarray DataLizenziert28. Januar 2005
-
Erfordert eine Authentifizierung Nicht lizenziertStepwise Normalization of Two-Channel Spotted MicroarraysLizenziert7. Februar 2005
-
Erfordert eine Authentifizierung Nicht lizenziertComparing Automatic and Manual Image Processing in FLARE Assay Analysis for Colon CarcinogenesisLizenziert14. März 2005
-
Erfordert eine Authentifizierung Nicht lizenziertPixel-level Signal Modelling with Spatial Correlation for Two-Colour MicroarraysLizenziert6. April 2005
-
Erfordert eine Authentifizierung Nicht lizenziertEmpirical Bayes Microarray ANOVA and Grouping Cell Lines by Equal Expression LevelsLizenziert18. April 2005
-
Erfordert eine Authentifizierung Nicht lizenziertMultiple Testing and Data Adaptive Regression: An Application to HIV-1 Sequence Data.Lizenziert18. April 2005
-
Erfordert eine Authentifizierung Nicht lizenziertEarly Diagnostic Marker Panel Determination for Microarray Based Clinical StudiesLizenziert26. April 2005
-
Erfordert eine Authentifizierung Nicht lizenziertPrediction of Missing Values in Microarray and Use of Mixed Models to Evaluate the PredictorsLizenziert5. Mai 2005
-
Erfordert eine Authentifizierung Nicht lizenziertCombined Association and Linkage Analysis for General Pedigrees and Genetic ModelsLizenziert5. Mai 2005
-
Erfordert eine Authentifizierung Nicht lizenziertIncorporating Biological Information as a Prior in an Empirical Bayes Approach to Analyzing Microarray DataLizenziert25. Mai 2005
-
Erfordert eine Authentifizierung Nicht lizenziertThe Relative Inefficiency of Sequence Weights Approaches in Determining a Nucleotide Position Weight MatrixLizenziert1. Juni 2005
-
Erfordert eine Authentifizierung Nicht lizenziertA Simple Loglinear Model for Haplotype Effects in a Case-Control Study Involving Two Unphased GenotypesLizenziert2. Juni 2005
-
Erfordert eine Authentifizierung Nicht lizenziertExtension of the SIMLA Package for Generating Pedigrees with Complex Inheritance Patterns: Environmental Covariates, Gene-Gene and Gene-Environment InteractionLizenziert6. Juni 2005
-
Erfordert eine Authentifizierung Nicht lizenziertError Distribution for Gene Expression DataLizenziert12. Juli 2005
-
Erfordert eine Authentifizierung Nicht lizenziertA General Framework for Weighted Gene Co-Expression Network AnalysisLizenziert12. August 2005
-
Erfordert eine Authentifizierung Nicht lizenziertStatistical Inference in Evolutionary Models of DNA Sequences via the EM AlgorithmLizenziert12. August 2005
-
Erfordert eine Authentifizierung Nicht lizenziertComparing Bacterial DNA Microarray FingerprintsLizenziert15. August 2005
-
Erfordert eine Authentifizierung Nicht lizenziertContinuous Covariates in Genetic Association Studies of Case-Parent Triads: Gene and Gene-Environment Interaction Effects, Population Stratification, and Power AnalysisLizenziert15. August 2005
-
Erfordert eine Authentifizierung Nicht lizenziertRobust Remote Homology Detection by Feature Based Profile Hidden Markov ModelsLizenziert6. September 2005
-
Erfordert eine Authentifizierung Nicht lizenziertEmpirical Bayes Estimation of a Sparse Vector of Gene Expression ChangesLizenziert6. September 2005
-
Erfordert eine Authentifizierung Nicht lizenziertHierarchical Inverse Gaussian Models and Multiple Testing: Application to Gene Expression DataLizenziert6. September 2005
-
Erfordert eine Authentifizierung Nicht lizenziertFADO: A Statistical Method to Detect Favored or Avoided Distances between Occurrences of Motifs using the Hawkes' ModelLizenziert12. September 2005
-
Erfordert eine Authentifizierung Nicht lizenziertPrediction of Genomewide Conserved Epitope Profiles of HIV-1: Classifier Choice and Peptide RepresentationLizenziert16. September 2005
-
Erfordert eine Authentifizierung Nicht lizenziertFold-Change Estimation of Differentially Expressed Genes using Mixture Mixed-ModelLizenziert21. September 2005
-
Erfordert eine Authentifizierung Nicht lizenziertTest on the Structure of Biological Sequences via Chaos Game RepresentationLizenziert21. September 2005
-
Erfordert eine Authentifizierung Nicht lizenziertReverse Engineering Galactose Regulation in Yeast through Model SelectionLizenziert27. September 2005
-
Erfordert eine Authentifizierung Nicht lizenziertEmpirical Bayes and Resampling Based Multiple Testing Procedure Controlling Tail Probability of the Proportion of False Positives.Lizenziert7. Oktober 2005
-
Erfordert eine Authentifizierung Nicht lizenziertWeighted Analysis of Paired Microarray ExperimentsLizenziert19. Oktober 2005
-
Erfordert eine Authentifizierung Nicht lizenziertA Probabilistic Approach to Large-Scale Association Scans: A Semi-Bayesian Method to Detect Disease-Predisposing AllelesLizenziert1. November 2005
-
Erfordert eine Authentifizierung Nicht lizenziertA Shrinkage Approach to Large-Scale Covariance Matrix Estimation and Implications for Functional GenomicsLizenziert14. November 2005
-
Erfordert eine Authentifizierung Nicht lizenziertStructured Antedependence Models for Functional Mapping of Multiple Longitudinal TraitsLizenziert16. November 2005
-
Erfordert eine Authentifizierung Nicht lizenziertCorrelation Between Gene Expression Levels and Limitations of the Empirical Bayes Methodology for Finding Differentially Expressed GenesLizenziert22. November 2005
-
Erfordert eine Authentifizierung Nicht lizenziertBayesian Statistical Studies of the Ramachandran DistributionLizenziert22. November 2005
-
Erfordert eine Authentifizierung Nicht lizenziertOn Reference Designs For Microarray ExperimentsLizenziert16. Dezember 2005
-
Erfordert eine Authentifizierung Nicht lizenziertComputing Asymptotic Power and Sample Size for Case-Control Genetic Association Studies in the Presence of Phenotype and/or Genotype Misclassification ErrorsLizenziert4. Januar 2006