关于build tool的构想--从ant说起

发表于:2007-06-22来源:作者:点击数: 标签:
ant ——你要是不会,出门都不好意思跟人打招呼的那个ant,每个人都用过。 它是一个build tool,用xml来描述target,用xml来设置每个task的属性。 ant的好处我们都体会到了 1。什么都是xml。而xml地球人都知道。 2。功能强大。从编译 java 文件到checkin cvs

   
  ant——你要是不会,出门都不好意思跟人打招呼的那个ant,每个人都用过。
  
  它是一个build tool,用xml来描述target,用xml来设置每个task的属性。
  
  ant的好处我们都体会到了
  
  1。什么都是xml。而xml地球人都知道。

  
  2。功能强大。从编译java文件到checkin cvs,反正几乎你想得到的功能它都能作。
  
  3。扩展容易,如果你发现某个功能ant没有,自己实现一个Task类就是。
  
  4。一些功能设计得很合理。比如javac和java自动检查时间戳和依赖关系检查等等。
  
  但是,用多了,发现缺点也不少
  
  1。什么都是xml。而xml的语法有些时候显得很繁琐。
  
  2。xml用来描述逻辑异常笨拙。
  
  3。所有的逻辑都只能在java里用Task实现。要做一些跨越不同Task之间的通讯很困难。比如:先读取第一个文件的时间戳,再读取另一个文件中储存的时间戳,再根据两个时间戳之间的距离判断下一步调用哪个task或者target。
  
  4。xml的代码重用困难。很难定义一些常用的xml element作为库,然后再不同文件甚至项目中重用。
  
  5。对module的支持有限。
  
  仔细想想,其实,需求发展到逻辑重用,模块管理,不同task通讯等,已经离描述数据这个xml最擅长的领域越来越远了。
  
  如果把task作为基本的组成元件,那么,上面提出的几点需求,都是关注于对这些基本元件的管理和组合。或者说,glue。
  
  到此,口号呼之欲出,那就是:script。
  
  很多script,作为一个完整的语言,是做glue的最理想选手。
  
  下面谈谈我对一个基于script的built tool的构想。
  
  首先,这个build tool仍然需要允许通过java来自定义task。
  
  我们定义这样一个接口:
  
  java代码:
  
  interface Command{
  Object execute(CommandContext ctxt)
  throws Throwable;
  }
  
  我们计划让所有的task(我们这里叫它们command)都实现这个接口。
  
  CommandContext负责传递一些象log之类的信息。
  
  这个execute返回一个Object,这个值作为这个Command的返回值,可以用来和其它的Command通信。
  
  我们允许这个函数抛出任何异常,这个framework将会处理这些异常。
  
  然后,定义一些基本的Command,比如,ReturnCommand负责直接返回某一个值
  
  java代码:
  
  class ReturnCommand implements Command{
  private final Object v;
  public Object execute(CommandContext ctxt){
  return v;
  }
  ReturnCommand(Object v){this.v=v;}
  }
  
  PrintCommand负责打印一句话
  java代码:
  
  class PrintCommand implements Command{
  private final String msg;
  public Object execute(CommandContext ctxt){
  ctxt.getLogger().log(msg);
  return null;
  }
  PrintCommand(String msg){this.msg=msg;}
  }
  
  FailCommand负责报告错误
  
  java代码:
  
  class FailCommand implements Command{
  private final String msg;
  public Object execute(CommandContext ctxt){
  throw new CommandException(msg);
  }
  FailCommand (String msg){this.msg=msg;}
  }
  
  如此等等。这样的基本元件还有很多,比如file copy, javac, zip, jar等。
  
  但是,如果仅仅如此,那么这个工具的能力最多也就和ant一样。
  
  我们最需要的,是把不同的command组合起来的能力。
  
  而组合,最常见的,就是顺序执行。
  
  java代码:
  
  class SeqCommand implements Command{
  private final Command c1;
  private final Command c2;
  public Object execute(CommandContext ctxt){
  c1.execute(ctxt);
  return c2.execute(ctxt);
  }
  SeqCommand (Command c1, Command c2){
  this.c1 = c1;
  this.c2 = c2;
  }
  }
  
  上面这个简单的Command,就负责按照顺序执行连续的两个command。
  
  除了顺序执行,还有错误处理。我们也许会希望,当某个步骤执行失败时,去执行另外一个动作,为此,我们需要先定义一个接口来描述错误恢复:
  
  java代码:
  
  interface CommandRecovery{
  Command recover(Throwable th)
  throws Throwable;
  }
  
  当某个command失败的时候,这个接口会被调用。实现这个接口,可以有选择地对某一种或者几种错误进行恢复。
  
  然后定义具体的错误恢复逻辑
  
  java代码:
  
  class RecoveredCommand implements Command{
  private final Command c1;
  private final CommandRecovery c2;
  public Object execute(CommandContext ctxt){
  try{
  return c1.execute(ctxt);
  }
  catch(Throwable th){
  return c2.recover(th).execute(ctxt);
  }
  }
  RecoveredCommand (Command c1, CommandRecovery c2){
  this.c1 = c1;
  this.c2 = c2;
  }
  }
  
  有try-catch,就有try-finally,我们也可以定义一个command,让它保证某个关键动作必然运行
  
  java代码:
  
  class FinallyCommand implements Command{
  private final Command c1;
  private final Command c2;
  public Object execute(CommandContext ctxt){
  try{
  return c1.execute(ctxt);
  }
  finally{
  c2.execute(ctxt);
  }
  }
  FinallyCommand (Command c1, Command 2){
  this.c1 = c1;
  this.c2 = c2;
  }
  }
  
  前面的顺序执行,我们是直接扔掉了前一个command的返回值。但是有些时候,我们也许希望根据第一个command的返回值来决定下一步的走向。为此,仿照CommandRecovery接口,定义CommandBinder接口:
  
  java代码:
  
  interface CommandBinder{
  Command bind(Object v);
  }
  
  然后定义BoundCommand类:
  
  java代码:
  
  class BoundCommand implements Command{
  private final Command c1;
  private final CommandBinder c2;
  public Object execute(CommandContext ctxt){
  final Object v = return c1.execute(ctxt);
  return c2.bind(v).execute(ctxt);
  }
  BoundCommand (Command c1, CommandBinder c2){
  this.c1 = c1;
  this.c2 = c2;
  }
  }
  
  先透露一下,这个BoundCommand非常重要,就是它负责在不同的command间传递信息。
  
  基本上的框架搭好了,下面,假设我们用一个类似groovy的脚本来写某个target,我们的目标是先取得当前时间,然后打印出这个时间,然后调用javac,最后在程序结束后,打印程序结束的信息:
  
  java代码:
  
  new BoundCommand(
  new GetTimeCommand(),
  new CommandBinder(){
  public Command bind(Object v){
  final Command c2 = new PrintCommand("build time is "+v);
  final Command javacc = new JavaCCommand();
  final Command done = new PrintCommand("build successful");
  return new SeqCommand(c2, new SeqCommand(javacc, done));
  }
  }
  );
  
  上面的代码,先调用GetTimeCommand,取得当前时间,然后把这个实现传递到这个匿名类中去,这个匿名类根据这个时间2,创建了下一步的command c2。
  
  接下来,它调用两次SeqCommand来表达两次顺序执行。
  
  最终,当这个command被执行的时候,它就会完成我们上面要求的几个步骤。
  
  不错,挺好。达到了在步骤间任意传递信息的要求。甚至,我们也可以重用某些command或者函数。
  
  唯一一个问题:这个代码他妈的比xml还恶心!
  
  这还是很简单的情况,如果我们综合顺序,错误处理,分支等等,代码会丑陋得不忍卒睹。
  
  看来,不是随便什么script都可以胜任的。
  
  那么,让我们先静下心来反过来想想,我们到底希望有什么样的语法呢?
  
  写伪码,应该是这样:
  
  java代码:
  
  time <- getCurrentTime
  print time
  javac
  print "success"
  
  我们的目标是:用脚本语言把前面繁杂的java代码屏蔽起来,让语法简洁的脚本自动调用上面那些臃肿的代码。
  
  幸好,我手头有一个脚本语言可以达到类似的语法,
  
  java代码:
  
  do {time=now} $
  info.print time >>
  javac {classpath=...; fork=...; compatibility="1.4";...} >>
  info.print "build successful"
  
  这些do, >>等函数其实是用SeqCommand, BoundCommand等实现的,只不过表面上看不到了。
  
  更加复杂的逻辑,比如包含顺序执行,也包含错误处理的:
  java代码:
  
  auto (info.println "build done") $
  do {time=now} $
  info.println ("build starting at " + time) >>
  do {t1 = readFile "file1"} $
  do {t2 = readFile "file2"} $
  let
  diff = t2 - t1;
  writeFile "file3" diff
  end
  
  这段脚本要先读取当前时间,然后打印build start;然后先后从file1和file2读取两个数;然后把这两个数的差额写入file3, 最后,无论成功与否,打印build done。
  
  auto函数的意思是:当后面那些东西执行完毕后,无论是否出现exception,都要打印"build done"。
  
  你如果感兴趣可以试着用java或者groovy写写,看看结果多么可怕。
  
  如此,一个完整的build框架就建立起来了,我们只要填空式地给系统加入各种command实现,一个灵活优美的build tool就出炉了。
  
  最后,预告一下,基于这个思想的open source 项目Neptune即将启动,欢迎有志之士参加。
  
  你可以参与这个框架核心的搭建(跟我合作),也可以编写独立的各种Command来丰富框架的功能。

原文转自:http://www.ltesting.net