Youhane's Undergraduate Thesis
题号:NC15487
时间限制:C/C++/Rust/Pascal 1秒,其他语言2秒
空间限制:C/C++/Rust/Pascal 114 M,其他语言228 M
64bit IO Format: %lld

题目描述

欢迎Ingress玩家来华工做这套Banner
大家都知道想从华南理工大学的本科毕业并不是一件简单的事情,作为一名大四即将毕业的学生,优酱正在为她的毕业论文愁眉不展,为什么呢?并不是毕业设计的课题太难了,而是毕业论文有着非常奇怪的格式要求,其中最令人头痛的就是如何正确地引用参考文献。

而众所周知,某工是一个制度非常严格而且变化速度非常快的学校。因此发生在毕业论文的Deadline当晚突然宣布参考文献的格式要求产生了变化以致于必须通宵改论文这样的紧急事态并不是什么稀奇的事情。因此为了防止自己毕不了业,优酱决定开发一款可以自动生成符合国际通用的常见参考文献格式(IEEE、Nature、APA、Harvard)的参考文献列表的软件,这样就算是学校突然改变主意,优酱也可以放心睡觉。

你可能很奇怪,这样的软件不是有一大把吗?什么Beginote啊,Womendeley啊,Onetero啊,Readtrihedron啊,然而乃要知道在大天朝,这些软件依赖的某不存在的学术搜索引擎因为某些不可描述的原因是无法访问的啊,所以这些成熟的软件并不能使用。而且更严重的问题是,由于优酱现在正在某黑心研究所实习,每天的个人时间都被压榨殆尽了,所以实在是没办法去开发这款对她来说很重要的软件了,没有办法她只能跑来找你帮忙。你能帮优酱顺利毕业吗?

插入论文元数据字段

因为优酱在她的毕业论文里只引用了期刊上的论文(Journal Paper),而且都是国外的,所以我们只关注Journal Paper的引用格式。我们都知道,一篇Paper的元数据大概(Metadata)由如下字段构成:

◆ 论文的标题(Paper Title),这是一个字符串,只包含ASCII编码内的可见字符和空格。
◆ 论文刊登的期刊的标题(Journal Title),这同样是一个只包含ASCII编码内的可见字符和空格的字符串。
◆ 论文刊登期刊的标题的缩写(Journal Title Abbreviation),这还是一个只包含ASCII编码内的可见字符和空格的字符串(为什么要强调这么多遍呢?因为优酱怕说不清楚被喷啊)。
◆ 论文刊登的年份,是一个至多四位的正整数,比如2018。
◆ 论文刊登的月份,如果论文刊登的月份是已知的话,是一个至多12的正整数。如果论文刊登的月份未知,是-1。
◆ 论文刊登的日子,如果论文刊登的日子是已知的话,是一个符合西历历法的,至多31的正整数。如果论文刊登的日子未知,是-1。
◆ 论文刊登的期刊的卷号(Volume),通常情况下,是一个整数,但有时也可能是一个一个只包含ASCII编码内的可见字符和空格的字符串。
◆ 论文刊登的期刊的期号(Issue),通常情况下,是一个整数,但有时也可能是一个一个只包含ASCII编码内的可见字符和空格的字符串。
◆ 论文刊登的期刊的页码(Pages),通常情况下,呈现xxxx-xxxx的形式,表示起始页码和终止页码,但有时也可能是一个一个只包含ASCII编码内的可见字符和空格的字符串。
◆ 论文刊登的文档识别码(doi),是一个一个只包含ASCII编码内的可见字符和空格的字符串,格式通常形如10.1038/nbt.3519。
◆ 作者人数(Author Count),是一个正整数,表示作者的人数,通常不会超过20(优酱并没有闲到强行在论文中引用人类基因组计划的Paper)。
◆ 作者名单(Author List),是一个由固定格式的字符串组成的列表,每一行都单独表示一名作者,形如:
Bray, Nicolas L.
Pimentel, Harold
Marine, Jean-Christophe
Geurts, Pierre
Aerts, Jan
van den Oord, Joost
Atak, Zeynep Kalender
Wouters, Jasper
Aerts, Stein

其中对于每行:英文逗号前面的部分,是作者的Last Name,如果Last Name分多节的话,节与节之间用空格隔开。英文逗号后面的部分,是作者的First Name,如果First Name分多节的话,节与节之间用逗号隔开。优酱保证她找来的测试数据都是真实的,作者的人名中就算包含奇怪的字符也都被换掉了,一定可以用ASCII编码,空格一定是节与节之间的分界点,且不会出现多余的空格。注意在学术论文中作者的顺序极为重要(因为涉及分赃问题),所以给出的作者顺序不可以调换。而且优酱保证对于每个人名,英文逗号只会出现一次,而且是用来分隔Last Name和First Name的。

当优酱想往软件中添加一篇论文的时候,会输入IMPORT命令,然后依序键入上述的元数据字段,格式大概如下(尖括号对应上文所述的字段):

IMPORT
<Paper Title>
<Journal Title>
<Journal Title Abbreviation>
<Year>
<Month>
<Day>
<Volume>
<Issue>
<Pages>
<doi>
<Author Count>
<Author List>

参考文献引用格式

接下来分别介绍四种常见的参考文献引用格式:

IEEE格式

下面是几个用IEEE表示的参考文献示例:

[1] C. Trapnell, L. Pachter, and S. L. Salzberg, "TopHat: Discovering splice junctions with RNA-Seq," Bioinformatics, vol. 25, no. 9, pp. 1105-1111, 2009.
[2] T. Kociumaka, "Minimal Suffix and Rotation of a Substring in Optimal Time," (Cpm2016), vol. 54, no. 28, pp. 1-1, 2016.
[3] D. I. Bolnick and W. E. Stutz, "Frequency dependence limits divergent evolution by favouring rare immigrants over residents," Nature, vol. 546, no. 7657, pp. 285-288, 2017.
[4] S. Aibar et al., "SCENIC: single-cell regulatory network inference and clustering," Nat. Methods, vol. 14, no. 11, pp. 1083-1086, Oct. 2017.

IEEE参考文献引用格式分为如下几个部分:

    1. 参考文献序号:在IEEE格式中,参考文献序号需要以[X]表示,其中X是整数序号。

    2. 作者名单:IEEE格式中对文献的作者名单表示要细化为如下的规则:

每名作者显示为<F. N.> <Last Name>:作者的First Name的每一节都要进行缩写,即:只保留名字的首字并进行大写化(如果首字是英文字母的话),然后加一个英文句号。而作者的Last Name要完整印出。
        2.1. 当作者只有一人时,直接印出作者名称。
        2.2. 当作者有两人时两位作者的名字直接用and链接。
        2.3. 当作者有三到六人时,对于排在前面的作者,用英文逗号链接,最后两位作者用逗号和and链接。
        2.4. 当作者超过六人时,只印出第一作者的名字,再印et al.,这是拉丁语缩写,表示“...等人”。
    3. 论文标题,要用英文双引号括起来,这个部分和下一部分分隔用的逗号是放在右边双引号内的。
    4. 期刊标题的缩写版本。
    5. 期刊卷号,前面要先印出vol.
    6. 期刊期号,前面要先印出no.
    7. 期刊页码,前面要先印出pp.
    8. 发表年月,如果知道月份的话,要先印出月份。如果表示月份的单词长度大于3,需要进行缩写(如果实在不知道月份的英文缩写请善用系统日历或字典,谢谢_(:_」∠)_)然后加英文句点,如果不需要缩写直接印出即可。然后印出年份。年月之间用空格隔开。
    9. 最后印一个英文句点,并换行。

建议您对应上面的样例确认所有的格式要求。

Nature格式

Nature格式的样例如下:

1. Tung, P. Y. et al. Batch effects and the effective design of single-cell gene expression studies. Sci. Rep. 7, 1-15 (2017).
2. Trapnell, C., Pachter, L. & Salzberg, S. L. TopHat: Discovering splice junctions with RNA-Seq. Bioinformatics 25, 1105-1111 (2009).
3. Kociumaka, T. Minimal Suffix and Rotation of a Substring in Optimal Time. (Cpm2016) 54, 1-1 (2016).

Nature参考文献引用格式分为如下几个部分:

    1. 参考文献序号:在Nature格式中,参考文献的序号服从X.格式,其中X是参考文献的整数序号。

    2. 作者名单:Nature格式的作者名单细化为如下几条规则:

每名作者显示为<Last Name>, <F. N.>即作者的Last Name在前完整印出,First Name的缩写在后,二者用英文逗号和一个空格隔开。First Name的缩写规则和IEEE是一样的。
        2.1. 当作者仅有一人时,直接印出作者名字。
        2.2. 当作者仅有两人时,二者的名字用&隔开。
        2.3. 当作者不超过五人时,前面的作者用,隔开,最后两位用&隔开。
        2.4. 当作者超过五人时,仅印出第一作者的名字,然后加et al.,这是拉丁文缩写,表示“...等人”。
    3. 论文标题,同下一部分用英文句点和空格隔开。
    4. 期刊标题的缩写版本,同下一部分用空格隔开。
    5. 期刊卷号,同下一部分用逗号隔开。
    6. 页码范围,同下一部分用空格隔开。
    7. 论文发表年份,用小括号扩起来。

    8. 英文句点,以及一个换行。

具体地,请参考上面给出的样例来确认格式要求的细节。

APA格式

APA格式的样例如下:
Trapnell, C., Pachter, L., & Salzberg, S. L. (2009). TopHat: Discovering splice junctions with RNA-Seq. Bioinformatics, 25(9), 1105-1111. https://doi.org/10.1093/bioinformatics/btp120
Kociumaka, T. (2016). Minimal Suffix and Rotation of a Substring in Optimal Time. (Cpm2016), 54(28), 1-1. https://doi.org/10.4230/lipics.cpm.2016.28
Tung, P. Y., Blischak, J. D., Hsiao, C. J., Knowles, D. A., Burnett, J. E., Pritchard, J. K., & Gilad, Y. (2017). Batch effects and the effective design of single-cell gene expression studies. Scientific Reports, 7(September 2016), 1-15. https://doi.org/10.1038/srep39921
Aibar, S., Gonzalez-Blas, C. B., Moerman, T., Huynh-Thu, V. A., Imrichova, H., Hulselmans, G., ... Aerts, S. (2017). SCENIC: single-cell regulatory network inference and clustering. Nature Methods, 14(11), 1083-1086. https://doi.org/10.1038/nmeth.4463

APA参考文献引用格式分为如下的几个部分:

    1. 作者:APA格式的作者名单细化为如下几条规则:

每名作者显示为<Last Name>, <F. N.>即作者的Last Name在前完整印出,First Name的缩写在后,二者用英文逗号和一个空格隔开。First Name的缩写规则和IEEE与Nature是一样的。
        1.1. 当作者只有一人时,直接印出即可。
        1.2. 当作者为两人时,两名作者的名字用, &连接。
        1.3. 当作者超过两人但不足八人时,前面的作者名字用逗号链接, 最后两名作者的名字用, &链接。
        1.4. 当作者超过七人时,先印出前六名作者的名字,然后加表示省略的, ...,然后印出最后一名作者的名字。
    2. 论文发表年份,需要用英文小括号括上,并加一句点同下一部分分隔。
    3. 论文标题,印出后加一句点同下一部分分隔。
    4. 期刊的完整标题,印出后加一逗号同下一部分分隔。
    5. 卷号和期号,服从<vol>(<issue>)的格式,印出后加一逗号同下一部分分隔。
    6. 页码,印出加一句点同下一部分分隔。
    7. doi链接,这一部分由字段中给出的doi转化而来,格式为https://doi.org/<doi>。
    8. 最后直接换行即可。

具体地,请参考上面的样例来确认格式要求的细节。

Harvard格式

Harvard参考文献引用格式的样例如下:

Aibar, S. et al. (2017) ‘SCENIC: single-cell regulatory network inference and clustering’, Nature Methods, 14(11), pp. 1083–1086. doi: 10.1038/nmeth.4463.
Gawad, C., Koh, W. and Quake, S. R. (2016) 'Single-cell genome sequencing: Current state of the science', Nature Reviews Genetics, 17(3), pp. 175-188. doi: 10.1038/nrg.2015.16.
Kociumaka, T. (2016) ‘Minimal Suffix and Rotation of a Substring in Optimal Time’, (Cpm2016), 54(28), pp. 1–1. doi: 10.4230/lipics.cpm.2016.28.
Bolnick, D. I. and Stutz, W. E. (2017) 'Frequency dependence limits divergent evolution by favouring rare immigrants over residents', Nature, 546(7657), pp. 285-288. doi: 10.1038/nature22351.

Harvard参考文献的引用格式分为如下几个部分:

    1. 作者:Harvard格式的作者名单细化为如下几条规则:

每名作者显示为<Last Name>, <F. N.>,即作者的Last Name在前完整印出,First Name的缩写在后,二者用英文逗号和一个空格隔开。First Name的缩写规则和IEEE、Nature与APA是一样的。
        1.1. 当只有一名作者的时候,请直接印出作者的名字。
        1.2. 当有两名作者的时候,两名作者的名字直接用and链接。
        1.3. 当作者数目大于二但不足四时,前两名作者的名字用英文逗号分隔,最后两名作者的名字用and分隔。
        1.4. 当作者超过三名时,只印出首位作者,然后加et al.,这是拉丁文缩写,表示"...等人"。
    2. 论文发表的年份,需要用英文小括号括上,并加一空格同下一部分分隔。
    3. 论文标题,需要用英文单引号括上,然后加一英文句点仝下一部分分隔。
    4. 刊载论文的期刊的完整标题,印出后加一英文句点仝下一部分分隔。
    5. 期刊卷号和期号,服从<vol>(<issue>)的格式,印出后加一句点同下一部分分隔。
    6. 论文页码,前加pp.,后加一英文句点同下一部分分隔。
    7. 论文文档索引号(doi),前加doi:。
    8. 最后印一个英文句点然后换行。

具体地,请参考上面的样例来确认格式要求的细节。

引用命令

当优酱需要输出引用时,会输入CITE命令,格式如下:

CITE <Format> <Paper Count> <Paper1> <Paper2> ...

其中<Format>可以是IEEE、Nature、APA或Harvard,表示需要以何种格式输出引用。<Paper Count>是一个整数,小于等于8,表示需要一齐输出多少篇论文的引用。<Paper>表示需要输出的论文的编号,论文是第几个被IMPORT进程序里的,论文的编号就是几。

例如,CITE IEEE 3 3 1 2的意思就是用IEEE格式输出一个引用列表,第一篇论文是第3个IMPORT进程序的,第二篇是第1个IMPORT进程序的,最后一篇论文是第2个IMPORT进程序的。

结束命令

当优酱执行完所有操作的时候,会输入一个END表示结束程序。

输入描述:

数据的构造如下:
<IMPORT>
<IMPORT>
<IMPORT>
<IMPORT>
<IMPORT>
<IMPORT>
<IMPORT>
<IMPORT>
<CITE>
<CITE>
<CITE>
<CITE>
END
其中每个尖括号字段表示一个指令块,格式请参照题目描述。优酱保证数据一定是规范的,没有多余的不可见字符。
优酱精选了八篇真实存在的论文的元数据当作本题的测试数据,这些论文的元数据都是Mendeley自动抓取的并经过了优酱的人工校对,应该没有重大问题。对应的引用也是使用权威软件Mendeley自动导出的,并且经过了优酱的人工审查确保已经替换了不适应ASCII编码的字符。这八篇论文的doi如下:
10.1038/nmeth.4463
10.1038/nbt.3519
10.1038/nmeth.4263
10.1038/nrg.2015.16
10.1093/bioinformatics/btp120
10.1038/srep39921
10.1038/nature22351
10.4230/lipics.cpm.2016.28

输出描述:

请按题目指示输出的和要求的引用列表,注意不要输出多余的不可见字符。
示例1

输入

复制
IMPORT
SCENIC: single-cell regulatory network inference and clustering
Nature Methods
Nat. Methods
2017
10
9
14
11
1083-1086
10.1038/nmeth.4463
14
Aibar, Sara
Gonzalez-Blas, Carmen Bravo
Moerman, Thomas
Huynh-Thu, Van Anh
Imrichova, Hana
Hulselmans, Gert
Rambow, Florian
Marine, Jean-Christophe
Geurts, Pierre
Aerts, Jan
van den Oord, Joost
Atak, Zeynep Kalender
Wouters, Jasper
Aerts, Stein

CITE IEEE 1 1

CITE Nature 1 1

CITE APA 1 1

CITE Harvard 1 1

END

输出

复制
[1] S. Aibar et al., "SCENIC: single-cell regulatory network inference and clustering," Nat. Methods, vol. 14, no. 11, pp. 1083-1086, Oct. 2017.
1. Aibar, S. et al. SCENIC: single-cell regulatory network inference and clustering. Nat. Methods 14, 1083-1086 (2017).
Aibar, S., Gonzalez-Blas, C. B., Moerman, T., Huynh-Thu, V. A., Imrichova, H., Hulselmans, G., ... Aerts, S. (2017). SCENIC: single-cell regulatory network inference and clustering. Nature Methods, 14(11), 1083-1086. https://doi.org/10.1038/nmeth.4463
Aibar, S. et al. (2017) 'SCENIC: single-cell regulatory network inference and clustering', Nature Methods, 14(11), pp. 1083-1086. doi: 10.1038/nmeth.4463.

说明

最后祝各位高年级参赛选手顺利毕业(´・ω・`)