XCMS包 联系客服

发布时间 : 星期六 文章XCMS包更新完毕开始阅读

这条语句主要作用是谱峰鉴定(peak identification),其结果存储在了一个‘xcmsset’类型的数据(不用管这个类型是啥意思)。

250:38 300:103 350:226 400:338 450:431 500:529 550:674 600:847 250:43 300:128 350:275 400:394 450:500 500:637 550:835 600:1027 250:25 300:93 350:227 400:337 450:411 500:498 550:640 600:758 250:19 300:67 350:169 400:258 450:301 500:373 550:488 600:580 250:24 300:60 350:166 400:254 450:315 500:391 550:501 600:582 250:31 300:71 350:183 400:280 450:338 500:422 550:532 600:604 250:41 300:105

350:212

400:319

450:416

500:533

550:684

600:838 250:27 300:107 350:232 400:347 450:440 500:549 550:712 600:905 250:24 300:87 350:200 400:293 450:351 500:426 550:548 600:661 250:22 300:65 350:161 400:243 450:293 500:358 550:483 600:561 250:28 300:69 350:157 400:229 450:282 500:364 550:493 600:592 250:30 300:81 350:188 400:280 450:356 500:473 550:618 600:765

每一行就是一个文件,并且谱峰鉴定结果用成对的数据形式来给出。分号前面的数字表示正在处理的质荷比(m/z),后面的数字表示到该质荷比时已经找出的峰数目(peaknumber)

这个语句看似简单,里面包含的参数却很多:

xcmsSet(files = NULL, snames = NULL, sclass = NULL, phenoData = NULL, profmethod = \profparam = list(),

polarity = NULL, lockMassFreq=FALSE, mslevel=NULL, nSlaves=0, progressCallback=NULL, scanrange = NULL, ...) 多数情况下,我们用这些默认值就够了。但对于特定的分析仪器或者数据,我们也需要优化一些参数。Findpeaks利用两种不同的算法来进行峰值检测(peak detection)。其中默认法是?ndPeaks.matchedFilter,另一种方法是?ndPeaks.centWave。 2.2.1 ?ndPeaks.matchedFilter 该法有几个参数需要考虑:

峰宽(peak width)可用标准方差(sigma) 或者半峰全宽(fwhm)来表示,默认值是FWHM=30 s。根据色谱类型,我们应当选择合适的峰宽。

步长(step)默认值是2,step=2.

存储,有四种方法, ‘bin’,‘binlin’,‘binlinbase’,‘intlin’,其中bin是默认方法。四种方法的具体意思自己看文献吧,最后一个不推荐用,第三个具体怎么设置,我也没咋看懂。 2.2.2 ?ndPeaks.centWave

该法更适合于高分辨率的仪器下的centroid mode的数据, 比如LC/{TOF,OrbiTrap,FTICR}-MS。binning在这里是不必要的。这里面有两个参数需要考虑: ppm,其选择和仪器精度有关

峰宽范围(peak width range):比如HPLC里用peakwidth=c(20,50) ,UPLC里是peakwidth=c(5,12), 单位是

秒。

说了这个多了,举例子吧(英语说明里这部分一笔带过,而且help里的例子也不适合batchfiles,如何设置这些参数的确让人有些摸不着头脑):

1. ?ndPeaks.matchedFilter

xset <- xcmsSet(cdffiles, method=’matchedFilter’,fwhm=60, step=3, profmethod='binlin' ) xset

An\

Timerange: 2507.6-4139.9 seconds (41.8-69 minutes) Massrange: 200.1-597.0233 m/z Peaks:2549 (about 212 per sample) PeakGroups: 0

Sampleclasses: KO, WT

Profilesettings: method = binlin step = 3 Memoryusage: 0.497 MB

最后结果如上,我用了matchedFilter方法,fwhm是60s,步长是3,存储方法是 binlin

2. ?ndPeaks.centWave

xset <-xcmsSet(cdffiles, method=’centWave’, ppm=5, peakwidth=c(10,20) )

xset

An\

Timerange: 2502.9-4476.4 seconds (41.7-74.6 minutes) Massrange: 200.1-600 m/z

Peaks:52907 (about 4409 per sample) PeakGroups: 0

Sampleclasses: KO, WT Profilesettings: method = bin step = 0.1 Memoryusage: 4.68 MB

最后结果如上,我用了centWave方法,ppm=5,峰宽范围是10-20s。

2.3样本间峰匹配 (peak match across samples) xset<- group(xset)

Group 有三种方法‘density’,‘mzClust’和‘nearest’。每种方法下都有一系列不同的参数。‘density’是默认方法。nearest’需要额外安装‘RANN’的包 才能实现。

Density:Group peaks together across samples using overlapping m/z bins andcalculation of smoothed peak distributions in chromatographic time。

mzClust:Runs high resolution alignment onsingle spectra samples stored in a given xcmsSet.

Nearest: Group peaks together across samples by creating a