识别Google Analytics(分析)中的常绿内容

连字符日期格式

第一种选择是创建一个发布日期维度,该维度以以下日期格式跟踪发布日期:

yyyy-mm-dd

这对人们来说很容易阅读,而且很容易找到在特定年,月或日发布的内容。 但是,很难操纵和细分6个月前发布的效果良好的文章,并将其与当今表现最好的人区分开来。

多亏了GA对正则表达式的支持,尽管这样做相当棘手,但仍可以执行此操作,并且由于GA对API中的正则表达式的限制为128个字符,因此略有棘手。

经过一番角力,这是我为2000年至6个月前发表的文章提出的:

  ^(20(00 | 01 | 02 | 03 | 04 | 05 | 06 | 07 | 08 | 09 | 10 | 11 | 12 | 13 | 14 | 15 | 16)-[0-9] + | 2017-0? (1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9))-[0-9] + $ 

uck 很难理解,祝你好运,手动编写。 该正则表达式实际上是由以下脚本生成的(对PerlMonks的提示):

这种方法的好处是,在GA界面中可以清晰地读取日期格式,并且正则表达式具有足够的灵活性,可以在段和过滤器中使用(尽管理想情况下是由脚本驱动的,因此正则表达式会随日期而变化)。

直接在Google表格中使用此方法的一种方法是设置服务器以输出正则表达式字符串,并按照以下示例使用Google表格中的IMPORTDATA函数将其拉入。

结合使用IMPORTDATA和CONCATENATE,可以获得动态更新的日期正则表达式

数值日期

另一种方法是从日期中删除连字符,以创建:

yyyymmdd

您需要将其记录为“自定义指标”而不是“维度”,这样,您就可以使用指标过滤器运算符来简单过滤小于6个月前的绝对数字,例如:

  ga:metric1 <20160902 

但是,这与第一个解决方案具有相同的轻微缺点,因为它只有在由脚本来更新日期的情况下才能很好地工作。 不过,这样做的好处是可以更轻松地使用Google表格插件。

如果将其作为维存储,则可以同样使用上面的正则表达式方法,但是如果没有连字符,它的可读性将变得更低!

自发布以来的小时数/天数

不过,最可靠的解决方案可能是设置数据层,以输出自文章发表以来的小时数和/或天数,并将其作为附加的自定义指标进行跟踪。

这样,您可以设置一个相当静态的过滤器,以查找自发布过滤器以来连续> x天的文章:

  ga:metric1> 10 

如果您将此设置为维度,则可以使用正则表达式,但是它们通常不太精确。 例如,以下正则表达式将过滤大于99的数字(即3个数字+):

  ga:dimension1 =〜\ d {3} 

注意:这使用花括号,Google Analytics(分析)仅支持花括号。

有用的工具

有一些有用的工具可以在使用正则表达式匹配日期的过程中提供帮助。

  • 正则表达式数字范围生成器-相当容易使用,只需输入最小和最大日期; 它甚至会向您显示达到正则表达式的步骤
  • Year-range-regex-对于更精通技术的人,这是一个Node.js程序包,可轻松为基于年份的范围生成正则表达式
  • Regex Tester-不仅仅是一种通用工具,而是一种简单的方法来判断您的正则表达式是否有效,如果不能,为什么不

结论

由于所有自定义维度搜索选项都集中在文本搜索和正则表达式(也用于文本匹配)上,因此标准报告界面在所有解决方案中均不适用。

令人沮丧的是,“ 自定义报告”中的“ 高级搜索”和“过滤器”选项都没有数值运算符支持,但是以上内容至少对于大多数报告需求而言都是可行的解决方案。