• Mon espace de travail
  • Aide IRIS
  • Par Publication Par Personne Par Unité
    • English
    • Français
  • Se connecter
Logo du site

IRIS | Système d’Information de la Recherche Institutionnelle

  • Accueil
  • Personnes
  • Publications
  • Unités
  • Périodiques
UNIL
  • English
  • Français
Se connecter
IRIS
  • Accueil
  • Personnes
  • Publications
  • Unités
  • Périodiques
  • Mon espace de travail
  • Aide IRIS

Parcourir IRIS

  • Par Publication
  • Par Personne
  • Par Unité
  1. Accueil
  2. IRIS
  3. Publication
  4. Probabilistic base calling of Solexa sequencing data.
 
  • Détails
Titre

Probabilistic base calling of Solexa sequencing data.

Type
article
Institution
UNIL/CHUV/Unisanté + institutions partenaires
Périodique
BMC Bioinformatics  
Auteur(s)
Rougemont, J.
Auteure/Auteur
Amzallag, A.
Auteure/Auteur
Iseli, C.
Auteure/Auteur
Farinelli, L.
Auteure/Auteur
Xenarios, I.
Auteure/Auteur
Naef, F.
Auteure/Auteur
Liens vers les personnes
Xenarios, Ioannis  
Iseli, Christian  
Liens vers les unités
Institut Suisse de Bioinformatique  
LICR@UNIL  
ISSN
1471-2105
Statut éditorial
Publié
Date de publication
2008
Volume
9
Première page
431
Langue
anglais
Résumé
BACKGROUND: Solexa/Illumina short-read ultra-high throughput DNA sequencing technology produces millions of short tags (up to 36 bases) by parallel sequencing-by-synthesis of DNA colonies. The processing and statistical analysis of such high-throughput data poses new challenges; currently a fair proportion of the tags are routinely discarded due to an inability to match them to a reference sequence, thereby reducing the effective throughput of the technology.
RESULTS: We propose a novel base calling algorithm using model-based clustering and probability theory to identify ambiguous bases and code them with IUPAC symbols. We also select optimal sub-tags using a score based on information content to remove uncertain bases towards the ends of the reads.
CONCLUSION: We show that the method improves genome coverage and number of usable tags as compared with Solexa's data processing pipeline by an average of 15%. An R package is provided which allows fast and accurate base calling of Solexa's fluorescence intensity files and the production of informative diagnostic plots.
Sujets

Bacteriophage phi X 1...

Base Sequence/genetic...

Chromosome Mapping/me...

Cluster Analysis

DNA, Viral/analysis

Expressed Sequence Ta...

Pattern Recognition, ...

Quality Control

Sequence Analysis, DN...

Software

Spectrometry, Fluores...

PID Serval
serval:BIB_54200D66E5BC
DOI
10.1186/1471-2105-9-431
PMID
18851737
WOS
000260490200001
Permalien
https://iris.unil.ch/handle/iris/117541
Open Access
Oui
Date de création
2012-10-18T07:10:56.546Z
Date de création dans IRIS
2025-05-20T19:51:44Z
Fichier(s)
En cours de chargement...
Vignette d'image
Nom

BIB_54200D66E5BC.P001.pdf

Version du manuscrit

preprint

Taille

503.55 KB

Format

Adobe PDF

PID Serval

serval:BIB_54200D66E5BC.P001

URN

urn:nbn:ch:serval-BIB_54200D66E5BC8

Somme de contrôle

(MD5):52b573a5653f6e44e1100b8075f91409

  • Copyright © 2024 UNIL
  • Informations légales