[Ilugc] [JOB] Yahoo! Search Technology - Content Operations

  • From: suraj@xxxxxxxxx (Suraj Kumar)
  • Date: Fri May 23 14:56:46 2008

Ever wondered what it takes to build a searchable database out of the wondrous
World  Wide Web?   Does  it excite  you to  write  software that  will manage  a
five-figure  number of  machines? Do  you believe  your software  should  do the
actual work while you spend your valuable time brainstorming a new software idea
at the snooker table?

We, in the Yahoo! Search Technology Content Operations team, do what it takes to
keep the underlying systems running better  and faster in order to keep Yahoo!'s
view of the WWW  up-to-date, relevant and fast.  If it means  seeing a method to
the madness of random disks failing  across a very large cluster of machines, so
be it.  If it means, we as the gate keepers of the whole setup, have to automate
testing the content building software to meet operating criteria, so be it.

About  our team:  Our team  deploys  and ensures  smooth running  of the  Search
Database content generation systems.  "Ensuring smooth running" is a big task by
itself and that involves writing a lot of software tools.

Given the large scale of  our setup, traditional problem solving techniques need
to  be approached  from  a new  set of  angles  simultaneously. To  give you  an
example,  a tiny  cluster (of  a  few dozen  machines) wouldn't  be affected  by
failing hard-drives because  probability of disks failing on  a given machine is
low. However, put thousands of machines into  the picture and we now have one of
these improbable events happening pretty frequently! We have about a dozen disks
failing  every day  and  so it  definitely  pays to  find out  the  causes on  a
continuous basis.

Now, we need a few more passionate people who not only have a zeal for operating
large scale systems but also have Automation in their blood.  Want to join us?

You should have solid software operations skills with the drive to fix issues as
they  arise  and the  knack  to  identify needed  tools  and  build those  tools
too. Your duties will be focused on:

   * Working with the rest of the team in knocking off ad-hoc maintenance tasks

   * Having and using the  wisdom to take a step back and  ask "How can we avoid
     doing these repetitive maintenance tasks?"

   * Contributing  independently to  build tools  that keep  the  search content
     building systems up and running

   * Communicating by  ways of documenting and mentoring  in an open-source-like
     Development Environment.

Needed Qualifications:
   * Proficiency in Perl, Shell Scripting
   * Very good knowledge of building web-based dashboards (CGI-Perl, PHP, etc.,)
   * Strong understanding of Unix systems and tools
   * 3+ years of experience developing Unix tools (in Perl / Shell)
   * Strong commitment to jump in and fix issues as they arise
   * Decent understanding of Networking concepts
   * Excellent trouble-shooting skills
   * Excellent Written and Oral skills
   * A BE/BS in CS/EE or Equivalent

Good-to-Have:
   * Exposure  to working  on Large  scale computing  environments  and Internet
     platforms
   * Exposure to Hadoop
   * Exposure to AJAX and related Web 2.0 frameworks (YUI, Catalyst, etc.,.)

How to reach us?
1) Please rate yourself on a scale of 1 to 10 on the following:
    a) Java
    b) C/C++
    c) Perl
    d) Python
    e) HTML, CSS
    f) Javascript, AJAX
    g) Networking Concepts (*NOT* cabling, configuring routers, etc.,.)
    h) Data Structures and Algorithms
    i) Shell Scripting
    j) Setting up / Maintaining Apache / MySQL
    k) SQL
    l) Unix / Linux administrative abilities
    m) Exposure to dot-com practices and concepts (Logs collection,
aggregation, monitoring, metrics, load balancing, etc.,.)
    n) Hadoop / Map Reduce
2) Make a valid JSON hash string containing your self-assessment on
the above 14 areas with the alphabetic index (a, b, c, ... n) as the
key and your rating as the value
        Here is an example. For rating yourself 8 on Perl and 7 on
Java you'd include {"c": 8, "a": 7}. You can leave out areas that you
don't want to rate yourself on.
3) Attach your resume in DOC / HTML / TXT / PDF format along with your
mail. Please DO NOT place any other text in your mail. (rfc822
compatible Signature beginning with a '--'  on a newline is okay)
4) Send your mail to sunson+yst@xxxxxxxxxxxxx. DO NOT REPLY TO THIS EMAIL.

Thanks for reading through!

  -Suraj

-- 
Home: http://sunson.in/

Other related posts: