Perl et la bioinformatique
2 livres et 2 critiques, dernière mise à jour le 4 septembre 2022 , note moyenne : 4.3
Détails du livre
Sommaire
Critiques (1)
10 commentaires
Introduction à Perl pour la bioinformatique
de James Tisdall
Traducteurs : Laurent Mouchard et Guénola Ricard
Public visé :
Débutant
Résumé de l'éditeur
Ce livre est une introduction pratique à la programmation en Perl pour les biologistes. Perl excelle dans les fonctions indispensables à cette discipline : traitement de chaînes de caractères, mise en réseau, possibilité de piloter d'autres programmes et prototypage rapide. Cet ouvrage ne nécessite aucune connaissance préalable de la programmation. Il envisage la programmation comme un outil à part entière et désormais indispensable de la recherche en biologie.
Édition : O'Reilly - 382 pages, 1re édition, 10 juillet 2002
ISBN10 : 2841772063 - ISBN13 : 9782841772063
Format Broché: 18 cm x 24 cm, poids 696 g, Intérieur : Noir et Blanc
- Préface
- 1. Biologie et informatique
- Organisation de l'ADN
- Organisation des protéines
- In Silico
- Limites du calcul
- 2. Premiers pas en Perl
- Une courbe d'apprentissage basse et longue
- Avantages de Perl
- Installation de Perl sur votre ordinateur
- Comment exécuter des programmes ?
- Éditeurs de texte
- Obtenir de l'aide
- 3. L'art de la programmation
- Différentes approches pour la programmation
- Édition-exécution-modification (et sauvegarde)
- Sauvegardes
- Messages d'erreur
- Débogage
- Un vivier de programmes
- Les programmes libres (open source)
- Stratégies de programmation
- Le processus de la programmation
- 4. Séquences et chaînes de caractères
- Représentation de données de séquences
- Un programme pour stocker une séquence d'ADN
- Concaténation de fragments d'ADN
- Transcription : ADN en ARN
- Utilisation de la documentation Perl
- Calcul du complément inverse d'un brin d'ADN en Perl
- Protéines, fichiers et tableaux
- Contexte scalaire et contexte de liste
- Exercices
- 5. Motifs et boucles
- Contrôle du flux du programme
- Format du code
- Recherche de motifs
- Comptage des nucléotides
- Séparation d'une chaîne de caractères en un tableau
- Manipulation de chaînes de caractères
- Écriture dans des fichiers
- Exercices
- 6. Sous-programmes et débogage
- Sous-programmes
- Portée et sous-programmes
- Arguments de la ligne de commande et tableaux
- Transmission de données aux sous-programmes
- Modules et bibliothèques de sous-programmes
- Correction des bogues
- Exercices
- 7. Mutations et nombres aléatoires
- Générateurs de nombres aléatoires
- Un programme qui utilise les nombres aléatoires
- Un programme pour simuler les mutations dans les séquences d'ADN
- Générer une séquence d'ADN aléatoire
- Analyse d'une séquence d'ADN
- Exercices
- 8. Le code génétique
- Hachages
- Structures de données et algorithmes pour la biologie
- Le code génétique
- Traduire de l'ADN en protéines
- Lire des séquences d'ADN contenues dans des fichiers au format FASTA
- Cadres de lecture
- Exercices
- 9. Cartes de restriction et expressions régulières
- Les expressions régulières
- Opérations Perl
- Exercices
- 10. GenBank
- Les fichiers GenBank
- Séparer la séquence des annotations
- Filtrer les annotations
- Indexer GenBank avec DBM
- Exercices
- 11. Protein Data Bank
- Vue d'ensemble de la PDB
- Fichiers et répertoires
- Fichiers de la PDB
- Filtrer les fichiers de la PDB
- Contrôler d'autres programmes
- Exercices
- 12. BLAST
- Obtenir BLAST
- Recherche de motifs et homologie
- Les fichiers de sortie de BLAST
- Filtrer les sorties BLAST
- Présenter les données
- Bioperl
- Exercices
- 13. Aspects avancés du langage Perl
- Quelques pistes pour aller plus loin
- Annexe A : Ressources
- Annexe B : Résumé Perl
- Index
Voilà un bon début pour les bioinformaticiens qui s'essayent à Perl! En effet, les cours sont progressifs et bien écrits! Mais le mieux, ce sont les exemples! En effet, on y parle fichiers Genbank, format FASTA, résultats de Blast! Par ces exemples concrets, l'apprentissage deviendrait presque facile! Et les codes et procédures ainsi écrites trouveront leur application très rapidement! Un bouquin explicite et concret pour les biologistes de formation, de bons exemples des problématiques de la biologie pour les informaticiens.
A recommander !
A recommander !
Commenter Signaler un problème
Bonjour,
Description :
Description :
Ce livre est une introduction pratique à la programmation en Perl pour les biologistes. Perl excelle dans les fonctions indispensables à cette discipline : traitement de chaînes de caractères, mise en réseau, possibilité de piloter d'autres programmes et prototypage rapide. Cet ouvrage ne nécessite aucune connaissance préalable de la programmation. Il envisage la programmation comme un outil à part entière et désormais indispensable de la recherche en biologie...
Lire la suite
Lire la suite
- Avez-vous lu ce livre ou pensez-vous le lire ?
- Souhaitez-vous ajouter une critique de ce livre sur la page de la rubrique ?
- Avez-vous un commentaire à faire ?
Bonjour,
Mon avis sur ce livre est partagé. Ne connaissant rien en programmation, j'avais commencé à apprendre à utiliser Perl dans le cadre de mon stage en bioinformatique avec ce livre. Il faut dire que l'impression première que j'ai eue est qu'il est très abordable, même s'il peut également être bien verbeux. Plus j'avançais avec, moins je me trouvais autonome : j'ai clairement l'impression que les choses sont recrachées tout prêtes. Mais des notions fondamentales telle recursivité ne sont abordées que de façon totalement exceptionnelle moins d'une page dans le chapitre 11, si je ne m'abuse...). Souvent, même l'algo y est limite omis ou en tout cas, son importance est (bien) diminuée. Je trouve que les hashes sont des éléments essentiels en Perl et leur présentation très succinte est dommageable. De même, on ne conseil au lecteur d'aller voir la perldoc que vers le chapitre 9...
Le jour où je l'ai laissé de côté pour reprendre d'autres docs, j'ai découvert avec déplaisir que ce livre m'avait donné pas mal de mauvaises habitudes.
Ce livre peut en fait se résumer à son Appendix B qui synthétise très bien pas mal de notions et utilisations et à la partie où l'utilisation du débuggeur est un peu explicitée.
Je considère donc que c'est un livre à vraiment prendre avec des pincettes : si c'est pour quelqu'un qui a envie de limite recopier du code et de l'utiliser sans plus, c'est très bien. En revanche, si la personne veut vraiment apprendre à faire de la programmation, je ne trouve pas son utilisation première très adéquate. Des cours et tutoriels pour apprendre le langage Perl sont à mes yeux plus intéressants autant pour comprendre les intérêts et la puissance de ce langage que pour apprécier justement le "There is more than one way to do it". Je trouve "Genomic Perl - From bioinformatics basics to working code" mieux écrit et plus efficace.
Cordialement,
Mon avis sur ce livre est partagé. Ne connaissant rien en programmation, j'avais commencé à apprendre à utiliser Perl dans le cadre de mon stage en bioinformatique avec ce livre. Il faut dire que l'impression première que j'ai eue est qu'il est très abordable, même s'il peut également être bien verbeux. Plus j'avançais avec, moins je me trouvais autonome : j'ai clairement l'impression que les choses sont recrachées tout prêtes. Mais des notions fondamentales telle recursivité ne sont abordées que de façon totalement exceptionnelle moins d'une page dans le chapitre 11, si je ne m'abuse...). Souvent, même l'algo y est limite omis ou en tout cas, son importance est (bien) diminuée. Je trouve que les hashes sont des éléments essentiels en Perl et leur présentation très succinte est dommageable. De même, on ne conseil au lecteur d'aller voir la perldoc que vers le chapitre 9...
Le jour où je l'ai laissé de côté pour reprendre d'autres docs, j'ai découvert avec déplaisir que ce livre m'avait donné pas mal de mauvaises habitudes.
Ce livre peut en fait se résumer à son Appendix B qui synthétise très bien pas mal de notions et utilisations et à la partie où l'utilisation du débuggeur est un peu explicitée.
Je considère donc que c'est un livre à vraiment prendre avec des pincettes : si c'est pour quelqu'un qui a envie de limite recopier du code et de l'utiliser sans plus, c'est très bien. En revanche, si la personne veut vraiment apprendre à faire de la programmation, je ne trouve pas son utilisation première très adéquate. Des cours et tutoriels pour apprendre le langage Perl sont à mes yeux plus intéressants autant pour comprendre les intérêts et la puissance de ce langage que pour apprécier justement le "There is more than one way to do it". Je trouve "Genomic Perl - From bioinformatics basics to working code" mieux écrit et plus efficace.
Cordialement,
Je partage ton avis général sur le livre .... Il peut servir en première intention, pour voir le but de la programmation en biologie ... Donner envie aux étudiants à se lancer dans la bioinformatique par exemple!
En même temps, je crois que c'est le but du livre, comme c'est résumé sur la quatrième de couverture :
Tout est dit: du code pour les biologistes pour mener à bien leurs projets ... un bouquin à lire en diagonale pour les autres, et pour se former à PERL voir les cours et tutoriels : http://perl.developpez.com/cours/
En même temps, je crois que c'est le but du livre, comme c'est résumé sur la quatrième de couverture :
Cet ouvrage servira de tremplin aux biologistes qui, néophytes en programmation, pourront rapidement progresser et réussir leurs projets. Les informaticiens désireux de s'initier à la bioinformatique y trouveront un aperçu de la problématique de cette discipline.
Détails du livre
Sommaire
Critiques (1)
10 commentaires
BLAST
An Essentiel Guide to the Basic Local Alignement Search Tool
de Ian Korf, Mark Yandell, Joseph Bedell
Public visé :
Débutant
Résumé de l'éditeur
Sequence similarity is a powerful tool for discovering biological function. Just as the ancient Greeks used comparative anatomy to understand the human body and linguists used the Rosetta stone to decipher Egyptian hieroglyphs, today we can use comparative sequence analysis to understand genomes. BLAST (Basic Local Alignment Search Tool), is a sophisticated software package for rapid searching of nucleotide and protein databases. It is one of the most important software packages used in sequence analysis and bioinformatics. Most users of BLAST, however, seldom move beyond the program's default parameters, and never take advantage of its full power.
BLAST is the only book completely devoted to this popular suite of tools. It offers biologists, computational biology students, and bioinformatics professionals a clear understanding of BLAST as well as the science it supports. This book shows you how to move beyond the default parameters, get specific answers using BLAST, and how to interpret your results. The book also contains tutorial and reference sections covering NCBI-BLAST and WU-BLAST, background material to help you understand the statistics behind BLAST, Perl scripts to help you prepare your data and analyze your results, and a wealth of tips and tricks for configuring BLAST to meet your own research needs.
Some of the topics covered include:
BLAST is the only comprehensive reference with detailed, accurate information on optimizing BLAST searches for high-throughput sequence analysis. This is a book that any biologist should own.
BLAST is the only book completely devoted to this popular suite of tools. It offers biologists, computational biology students, and bioinformatics professionals a clear understanding of BLAST as well as the science it supports. This book shows you how to move beyond the default parameters, get specific answers using BLAST, and how to interpret your results. The book also contains tutorial and reference sections covering NCBI-BLAST and WU-BLAST, background material to help you understand the statistics behind BLAST, Perl scripts to help you prepare your data and analyze your results, and a wealth of tips and tricks for configuring BLAST to meet your own research needs.
Some of the topics covered include:
- BLAST basics and the NCBI web interface
- How to select appropriate search parameters
- BLAST programs: BLASTN, BLASTP, BLASTX, TBLASTN, TBLASTX, PHI-BLAST, and PSI BLAST
- Detailed BLAST references, including NCBI-BLAST and WU-BLAST
- Understanding biological sequences
- Sequence similarity, homology, scoring matrices, scores, and evolution
- Sequence Alignment
- Calculating BLAST statistics
- Industrial-strength BLAST, including developing applications with Perl and BLAST
BLAST is the only comprehensive reference with detailed, accurate information on optimizing BLAST searches for high-throughput sequence analysis. This is a book that any biologist should own.
Édition : O'Reilly - 339 pages, 1re édition, 1er septembre 2003
ISBN10 : 0596002998 - ISBN13 : 9780596002992
- Introduction
- Hello BLAST
- Theory
- Biological Sequences
- Sequence Alignment
- Sequence Similarity
- Practice
- BLAST
- Anatomy of a BLAST Report
- A BLAST Statistics Tutorial
- 20 Tips to Improve Your BLAST Searches
- BLAST Protocols
- Industrial-Strength BLAST
- Installation and Command-Line Tutorial
- BLAST Databases
- Hardware and Software Optimizations
- BLAST Reference
- NCBI-BLAST Reference
- WU-BLAST Reference
- Appendixes
- NCBI Display Formats
- Nucleotide Scoring Schemes
- NCBI-BLAST Scoring Schemes
- blast-imager.pl
- blast2table.pl
- Glossary
- Index
Ce livre s'adresse aux personnes ne connaissant pas ou peu BLAST. Selon les auteurs, il convient également aux étudiants et chercheurs ayant déjà une expérience avec BLAST, mais souhaitant connaître des astuces supplémentaires.
Ainsi, il convient aux personnes venant d'autres domaines de la science (physiciens, matheux, informaticiens purs) qui s'intéressent aux outils existant aujourd'hui pour l'analyse des données biologiques, mais n'ont pas de connaissances en biologie.
La première partie explique rapidement ce qu'est BLAST, en donnant des exemples via le web. La 2e partie est très théorique : on y parle autant des postulats biologiques de base qui font que BLAST fonctionne ainsi (similarité des séquences est le mot-clé) que de l'algorithme qui en est à la base et on donne quelques explications de ce qu'est la programmation heuristique.
La 3e partie est de la pratique : quelle tête à une sortie de BLAST ainsi que des conseils pour le choix de paramètres pour ce programme. Il y a pas mal d'astuces ici (il s'agit du chapitre 9).
Je pense que la lecture des parties 2 et 3 est un passage obligé pour tout le monde au moins une fois, même si l'on considère bien connaître la bête. BLAST ne constitue en aucun cas un outil d'analyse biologique, mais est l'outil qui la permet : en effet, il va toujours sortir un résultat, c'est à vous de dire s'il est biologiquement pertinent. D'où l'importance de la connaissance des fondements théoriques sous-jacents.
Ensuite, la partie 4 est consacrée à l'installation et l'utilisation de BLAST en local... sur les systèmes d'exploitation disponibles en 2003 . Le chapitre 11 est pour moi assez intéressant : il décrit les différentes façons de faire une base de données indexable par BLAST (donc, parle de l'utilisation de l'utilitaire formatdb) et donne également un overview de certaines banques de données biologiques. Cela dit, le tutorial sur le site du NCBI concernant formatdb est très bien également; les connaissances des banques de données biologiques dont il est question ont également pas mal évolué. Donc, ce chapitre est à lire en tant qu'introduction, mais un replacement dans le contexte actuel est nécessaire pour éviter les biais. Le chapitre 12 est également intéressant : il donne quelques informations sur les vitesses d'exécution du programme ainsi que sur les différentes optimisations de BLAST (le code source en C est disponible sur le site du NCBI, donc ce n'est pas étonnant que ces versions aient pu être créées).
Ainsi, le passage à la partie 5 se fait tout naturellement : on donne des caractéristiques assez détaillées des deux grands BLAST : celui du NCBI et celui de l'Université de Washington (le WU-BLAST), les deux étant comparés dans le Tableau 1 du chapitre 14.
Enfin, plusieurs petits scripts en Perl ponctuent tout le livre et sont également donnés dans les Appendix. Il s'agit essentiellement de scripts astuces : si l'on ne sait pas utiliser Perl, ce n'est pas ici qu'on l'apprendra; ce n'est aucunement l'objectif du livre d'ailleurs. Il est tout de même dommage qu'il n'ait fait appel qu'à Perl : autres langages ont des ensembles de modules spécialisés pour la biologie, tels Python avec Biopython, Java avec Biojava, Ruby avec Bioruby; il me semble aussi être tombée sur un début d'équivalent en C++.
En conclusion, ce livre est un excellent début pour les débutants complets et un peu initiés, mais n'apportera que des astuces épisodiques aux utilisateurs habitués.
Bonne lecture!
Ainsi, il convient aux personnes venant d'autres domaines de la science (physiciens, matheux, informaticiens purs) qui s'intéressent aux outils existant aujourd'hui pour l'analyse des données biologiques, mais n'ont pas de connaissances en biologie.
La première partie explique rapidement ce qu'est BLAST, en donnant des exemples via le web. La 2e partie est très théorique : on y parle autant des postulats biologiques de base qui font que BLAST fonctionne ainsi (similarité des séquences est le mot-clé) que de l'algorithme qui en est à la base et on donne quelques explications de ce qu'est la programmation heuristique.
La 3e partie est de la pratique : quelle tête à une sortie de BLAST ainsi que des conseils pour le choix de paramètres pour ce programme. Il y a pas mal d'astuces ici (il s'agit du chapitre 9).
Je pense que la lecture des parties 2 et 3 est un passage obligé pour tout le monde au moins une fois, même si l'on considère bien connaître la bête. BLAST ne constitue en aucun cas un outil d'analyse biologique, mais est l'outil qui la permet : en effet, il va toujours sortir un résultat, c'est à vous de dire s'il est biologiquement pertinent. D'où l'importance de la connaissance des fondements théoriques sous-jacents.
Ensuite, la partie 4 est consacrée à l'installation et l'utilisation de BLAST en local... sur les systèmes d'exploitation disponibles en 2003 . Le chapitre 11 est pour moi assez intéressant : il décrit les différentes façons de faire une base de données indexable par BLAST (donc, parle de l'utilisation de l'utilitaire formatdb) et donne également un overview de certaines banques de données biologiques. Cela dit, le tutorial sur le site du NCBI concernant formatdb est très bien également; les connaissances des banques de données biologiques dont il est question ont également pas mal évolué. Donc, ce chapitre est à lire en tant qu'introduction, mais un replacement dans le contexte actuel est nécessaire pour éviter les biais. Le chapitre 12 est également intéressant : il donne quelques informations sur les vitesses d'exécution du programme ainsi que sur les différentes optimisations de BLAST (le code source en C est disponible sur le site du NCBI, donc ce n'est pas étonnant que ces versions aient pu être créées).
Ainsi, le passage à la partie 5 se fait tout naturellement : on donne des caractéristiques assez détaillées des deux grands BLAST : celui du NCBI et celui de l'Université de Washington (le WU-BLAST), les deux étant comparés dans le Tableau 1 du chapitre 14.
Enfin, plusieurs petits scripts en Perl ponctuent tout le livre et sont également donnés dans les Appendix. Il s'agit essentiellement de scripts astuces : si l'on ne sait pas utiliser Perl, ce n'est pas ici qu'on l'apprendra; ce n'est aucunement l'objectif du livre d'ailleurs. Il est tout de même dommage qu'il n'ait fait appel qu'à Perl : autres langages ont des ensembles de modules spécialisés pour la biologie, tels Python avec Biopython, Java avec Biojava, Ruby avec Bioruby; il me semble aussi être tombée sur un début d'équivalent en C++.
En conclusion, ce livre est un excellent début pour les débutants complets et un peu initiés, mais n'apportera que des astuces épisodiques aux utilisateurs habitués.
Bonne lecture!
Commenter Signaler un problème
Bonjour,
Description :
J'aimerais savoir si quelqu'un a lu ce livre et s'il le recommande?
Merci,
Description :
Sequence similarity is a powerful tool for discovering biological function. Just as the ancient Greeks used comparative anatomy to understand the human body and linguists used the Rosetta stone to decipher Egyptian hieroglyphs, today we can use comparative sequence analysis to understand genomes. BLAST (Basic Local Alignment Search Tool), is a sophisticated software package for rapid searching of nucleotide and protein databases. It is one of the most important software packages used in sequence analysis and bioinformatics. Most users of BLAST, however, seldom move beyond the program's default parameters, and never take advantage of its full power...
Lire la suite
Lire la suite
- Avez-vous lu ce livre ou pensez-vous le lire ?
- Souhaitez-vous ajouter une critique de ce livre sur la page de la rubrique ?
- Avez-vous un commentaire à faire ?
J'aimerais savoir si quelqu'un a lu ce livre et s'il le recommande?
Merci,
Ah ouais, moi en tout cas, je ne l'ai pas lu. Une critique sur ce livre serait pas mal en effet.
Salut,
Je l'ai, il n'est pas mal. Mais ça dépend pourquoi faire. Si tu ne connais que pas ou peu BLAST, c'est LE bouquin à lire. Si tu n'as jamais suivi de cours de bio, pareil. Mais si tu es déjà dedans, ça t'apportera des astuces épisodiques genre un overview sur le traitement des oligos, quels paramètres utiliser pour tel cas particulier ou tel autre, comment installer sur MacOS9 . Il n'y a pratiquement pas de code et les exemples sont uniquement en Perl (ce que je trouve tout de même dommage, sachant qu'il y a d'autres langages pour faire de la bioinfo avec l'équivalent de BioPerl correspondant).
Donc, voilà, définis tes besoins et décides en conséquence
Si tu as besoin d'autres éclaircissements, n'hésite pas, si je peux te renseigner
Je l'ai, il n'est pas mal. Mais ça dépend pourquoi faire. Si tu ne connais que pas ou peu BLAST, c'est LE bouquin à lire. Si tu n'as jamais suivi de cours de bio, pareil. Mais si tu es déjà dedans, ça t'apportera des astuces épisodiques genre un overview sur le traitement des oligos, quels paramètres utiliser pour tel cas particulier ou tel autre, comment installer sur MacOS9 . Il n'y a pratiquement pas de code et les exemples sont uniquement en Perl (ce que je trouve tout de même dommage, sachant qu'il y a d'autres langages pour faire de la bioinfo avec l'équivalent de BioPerl correspondant).
Donc, voilà, définis tes besoins et décides en conséquence
Si tu as besoin d'autres éclaircissements, n'hésite pas, si je peux te renseigner