学R学系列-01-正则表达式

R语言学习教程-[学R学]:正则表达式

本讲主要介绍正则表达式(regular expression, regex)的概念、主要语法风格以及在R中的使用方法。


为何讲它

一周前,在学习The Art of R Programming第35页的时候遇到一个练习,我想用模式匹配去解决,也就是regex,但遇到了未曾料到的问题,于是我在stackoverflow上提问了,大牛的解答让我想要集中几天精力搞清楚regex到底怎么用,问题见此:my question不巧被标记了重复...

regex是一个相对独立的内容,几乎所有编程语言都实现了这种功能,这也证明了它的重要性,另外,本讲标题序号虽然是01,但其实大家可以放在遇到实际问题时再来学,那样有了共鸣,印象更深刻!

正则表达式

我们在面对生物数据,尤其是序列信息(比如碱基序列、氨基酸序列等)的时候, 会时常想要问自己,这其中是否包含着且含有多少某种已知的模式,一段DNA中是否包含转录起始特征TATA box、一段RNA中是否包含某种lncRNA、一段肽链中是否包含锌指结构等等;另一方面,我们在操作数据时,会时常遇到诸如把某个字符(对象)换成另一种字符(对象)的替换操作,而其本质还是如何搜索符合某种(替换)模式的对象。

在这些几乎天天都可以碰到的模式匹配/搜索问题中,正则表达式就是一把解决问题的利剑!


更多内容请看

01-正则表达式





  • 发表于 2018-01-26 21:38
  • 阅读 ( 3189 )
  • 分类:编程语言

2 条评论

请先 登录 后评论
不写代码的码农
文虎

博士

9 篇文章

作家榜 »

  1. 祝让飞 118 文章
  2. 柚子 91 文章
  3. 刘永鑫 64 文章
  4. admin 57 文章
  5. 生信分析流 55 文章
  6. SXR 44 文章
  7. 张海伦 31 文章
  8. 爽儿 25 文章